Budowa modelu scoringowego bazuje na metodach znanych z innych zastosowań, ale również na metodach specjalizowanych, dedykowanych budowie modeli scoringowych. Poznasz metody z tych obu grup. Zrozumiesz też wieloetapowy proces budowy modelu scoringowego.

Po szkoleniu będziesz w stanie zbudować model scoringowy. Być może będzie to Twój pierwszy model. Nawet, jeśli zaczniesz szkolenie bez wiedzy z tej dziedziny.

Dzięki temu, że szkolenie jest w R, to po jego zakończeniu będziesz w stanie pracować na swoich danych w tym narzędziu. A z czasem przygotujesz swój własny warsztat służący do budowy modeli: efektywny, wygodny, z dobrymi metodami — takimi, jakie lubisz i dostosowanymi do specyfiki portfeli kredytowych, z którymi pracujesz.


Czego się nauczysz?

  • Po szkoleniu będziesz w stanie zbudować model scoringowy. Nawet, jeśli zaczniesz szkolenie bez wiedzy z tej dziedziny.
  • Poznasz wszystkie etapy procesu budowy systemu scoringowego: od zebrania danych, poprzez wybór cech i wyznaczenie punktów scoringowych, ocenę jakości, aż do monitorowania działającego systemu.
  • Nauczysz się przygotowywać dane do budowy modeli scoringowych.
  • Poznasz metody statystyczne stosowane w budowie kart scoringowych.
  • Dowiesz się, jak radzić sobie z brakiem informacji o wnioskach odrzuconych (reject inference).
  • Zapoznasz się ze sposobami oceny jakości modeli scoringowych.
  • Poznasz podstawy R.
  • Wszystko przećwiczysz w praktyce na komputerze: używamy systemu RRCommander.
  • Otrzymasz obszerne materiały umożliwiające samodzielną późniejszą pracę, w tym skrypty R.


Dla kogo jest to szkolenie?

Pracownicy departamentów ryzyka kredytowego, audytu, IT:

  • budujący modele scoringowe lub zamierzający budować modele scoringowe,
  • monitorujący działanie modeli scoringowych,
  • walidujący modele scoringowe,
  • analitycy ryzyka kredytowego,
  • wszyscy zainteresowani poznaniem sposobów budowy systemów scoringowych i zrozumieniem ich działania.

Jeśli w pracy nie używasz R, to i tak skorzystasz ze szkolenia. Przedstawiane metody to best practices i dostępne są w różnych narzędziach. System R służy do ich ilustracji. Dzięki użyciu R na szkoleniu uzyskasz wiedzę i praktyczne umiejętności niezależne od komercyjnego oprogramowania.


Skrót programu szkolenia

  • Wstęp i krótkie wprowadzenie do R
  • Przegląd etapów kompletnego procesu budowy systemu scoringowego
  • Analiza i przekształcenia cech do budowy systemu scoringowego
  • Regresja logistyczna: podstawy teoretyczne i praktyka
  • Metody wyboru cech do budowy modelu
  • Sposoby oceny jakości systemu scoringowego
  • Uwzględnienie wniosków odrzuconych (reject inference)
  • Wykorzystywanie systemu scoringowego w praktyce


Program szkolenia

  1. Krótkie wprowadzenie do R
    • wprowadzenie do środowiska R
      • specyfika i przegląd możliwości systemu
      • instalacja i konfiguracja
      • użytkowanie R
      • system pomocy
      • graficzny interfejs użytkownika
      • korzystanie z wbudowanych funkcji
    • R od podstaw: typy i struktury danych
      • typy zmiennych
      • obiekty i ich podstawowe własności (wektory, macierze, zmienne tekstowe, listy i ramki danych)
      • podstawowe operacje na obiektach
    • elementy programowania w R
      • podstawy języka R
      • instrukcje sterujące przepływem kodu
      • tworzenie własnych skryptów i funkcji
  2. Wstęp
    • ocena ryzyka kredytowego przed powstaniem systemów scoringowych
    • zalety i obszary stosowania systemów scoringowych
    • idea działania: wykorzystanie danych historycznych do przewidywania przyszłego zachowania
    • zalety i wady punktowej oceny ryzyka
    • korzyści wynikające z zastosowania systemów scoringowych
    • rodzaje systemów scoringowych
      • podział ze względu na zastosowanie
      • podział ze względu na sposób budowy
      • łączenie różnych rodzajów scoringu
  3. Przegląd etapów kompletnego procesu budowy systemu scoringowego
    • organizacja projektu (w tym definicja celu biznesowego dla systemu scoringowego)
    • wstępna analiza danych
    • definicja parametrów
      • definicja dobrego i złego klienta: przekształcenie celu biznesowego na cel statystyczny
      • application window i performance window
      • wykluczenia
      • segmentacja
    • przygotowanie danych
      • cechy stosowane w scoringu
      • wybór próby konstrukcyjnej
      • zgromadzenie i oczyszczenie danych
    • budowa karty scoringowej w skrócie
      • analiza i przekształcenia cech do budowy systemu scoringowego
      • regresja logistyczna: podstawy teoretyczne i praktyka
      • metody wyboru cech do budowy modelu
      • sposoby oceny jakości systemu scoringowego
      • uwzględnienie wniosków odrzuconych (reject inference)
    • wykorzystywanie systemu scoringowego w praktyce
      • raporty podsumowujące proces budowy karty scoringowej
      • wdrożenie karty (w tym dobór punktu odcięcia: iso-risk, iso-acceptance)
      • monitorowanie karty
  4. Analiza i przekształcenia cech do budowy systemu scoringowego
    • analiza pojedynczych cech
      • Weight of Evidence, odds
      • rozkłady cech (tablice kontyngencji, histogramy)
      • obserwacje brakujące oraz obserwacje odstające
      • kontrola jakości i czyszczenie danych
      • wstępny wybór cech do konstrukcji modelu — analiza zdolności dyskryminacyjnej cech
    • przedziałowanie zmiennych ciągłych (fine classing i coarse classing)
      • rola przedziałowania
      • przedziałowanie metodą weight of evidence (WoE)
    • analiza zależności między cechami i konstrukcja cech pochodnych (generated characteristics, cross characteristics)
  5. Regresja logistyczna: podstawy teoretyczne i praktyka
    • wprowadzenie do regresji logistycznej
      • zalety regresji logistycznej
      • modele regresyjne — wprowadzenie na przykładzie regresji liniowej
      • czym jest scoring: model liniowy, model logit i probit
    • idea modelu (trzy podejścia: dummy variables, przekodowanie WoE, modele dla zmiennych ciągłych)
    • podstawy statystyczne
    • budowa modelu, własności praktyczne i teoretyczne
    • dwa podejścia do budowy systemów scoringowych metodą regresji logistycznej
    • interpretacja wyników
    • diagnostyka modelu: testy statystyczne i wykresy
    • wnioskowanie statystyczne dla regresji logistycznej
    • inne metody budowy systemów scoringowych oraz ich wady i zalety
  6. Metody wyboru cech do budowy modelu
    • wprowadzenie do oceny jakości modelu
    • kryteria zastosowania cech w scoringu (statystyczne, biznesowe, operacyjne)
    • wartość informacyjna cechy (information value)
    • przegląd zupełny zbioru cech
    • inne sposoby wyboru cech
      • metody forward, backward bazujące na jakości klasyfikacji
      • metody krokowe bazujące na kryterium AIC
  7. Sposoby oceny jakości systemu scoringowego
    • kryteria dobroci dopasowania modelu (AIC, R^2)
    • analiza zdolności predykcyjnej modelu
    • rozkłady punktów scoringowych
    • ocena jakości klasyfikacji: confusion matrix
    • ocena zdolności dyskryminacyjnej: krzywa ROC, miary AR, KS i dywergencja
  8. Uwzględnienie wniosków odrzuconych (reject inference)
    • idea reject inference
    • przegląd metod reject inference
      • define as bad
      • extrapolation
      • augmentation
  9. Wykorzystywanie systemu scoringowego w praktyce
    • dobór optymalnego punktu odcięcia
    • wdrożenie systemu scoringowego
    • monitorowanie skuteczności działania systemu i raportowanie
      • monitorowanie siły predykcyjnej systemu
      • monitorowanie siły predykcyjnej cech
      • monitorowanie stabilności populacji
    • strategia champion-challenger

Spróbuj ponownie