data mining

Po rozmowie z panią prof. Ewą Damek z Instytutu Matematycznego Uniwersytetu Wrocławskiego powstała taka krótka lista. Nie jest ona kompletna, ale według mnie będzie przydatna. Chodzi o to, co powienien umieć student lub absolwent matematyki, który chciałby odbyć staż w QuantUp albo pracować w instytucji finansowej — typowym miejscu pracy matematyka. Lista wygląda jak spis umiejętności, które powinien mieć naukowiec ds. danych (ang. data scientist), [...]

1 Wstęp Bardzo często budując modele scoringowe oraz predykcyjne korzysta się bezkrytycznie z metod krokowego wyboru cech (ang. stepwise feature selection methods). Szczególnie w sytuacji, gdy wybieramy spośród wielu cech objaśniających mogących objaśniać zjawisko. Dotyczy to scoringów behawioralnych ryzyka kredytowego albo modeli opisujących zachowanie klienta w CRM albo marketingu bezpośrednim (modele np. churn, attrition czy response). Stosuje się wtedy warianty ”forward feature [...]

Ocena dokładności prognoz (zdolności predykcyjnej/prognostycznej modelu) jest nieodzownym etapem budowy każdego modelu. W praktyce porównujemy skuteczność prognoz, aby: 1) wybrać najbardziej efektywną metodę dla danych, 2) znaleźć optymalny podzbiór cech (zmiennych objaśniających) lub 3) dobrać optymalne parametry dla stosowanej metody. Schematy oceny skuteczności modelu (takie jak np.: random split, cross-validation (CV) czy bootstrap) są powszechnie znane [...]

Spróbuj ponownie