Szkolenie

Analiza danych,

Data mining w praktyce z wykorzystaniem R

Prowadzący: Artur Suchwałko,

Program: PDF lub poniżej

Rodzaj: Otwarte + wewnętrzne

Czas trwania: 2 dni

Najbliższe szkolenie: Kraków, 17-18.03.2016

Cena: 2.500 zł netto (+23% VAT)

Szkolenie wewnętrzne: Zakres i termin do ustalenia. Grupy już od trzech osób.


Mogą cię zainteresować: System R: podstawy, operacje na danych, analiza danych, grafika oraz programowanie, Budowa modeli predykcyjnych w R, Credit scoring w praktyce z wykorzystaniem R,

Terminy szkoleń: Sprawdź


To szkolenie jest w R: dlaczego warto?  

Masz do dyspozycji dużo danych. Z pewnością chcesz znaleźć w nich istotne informacje, które pomogą zrozumieć analizowane zjawisko albo poprawić funkcjonowanie firmy.

Na szkoleniu nauczysz się, jak przygotować dane do analizy, a następnie zastosować odpowiednie metody, aby wydobyć użyteczne informacje na temat procesu czy zjawiska, które te dane opisują. Wykorzystamy do tego system R.

System statystyczny R jest potężnym i darmowym narzędziem. Stosowany jest praktycznie we wszystkich dziedzinach. Jeśli go nie znasz, to dowiedz się, dlaczego warto używać R.


Czego się nauczysz?

  • Zrozumiesz metodologię analizy danych metodami data mining.
  • Zdobędziesz praktyczne umiejętności w tej dziedzinie.
  • Nauczysz się przygotowywać dane do analizy.
  • Poznasz metody eksploracji danych i budowy modeli predykcyjnych: metody klasyfikacji obiektów (używane w budowie modeli predykcyjnych), metody analizy skupień (odkrywanie segmentów klientów), metody redukcji wymiaru (prezentacja graficzna danych wielowymiarowych) oraz metody odkrywania reguł asocjacyjnych (analiza koszyka zakupów).
  • Zapoznasz się ze sposobami oceny jakości modeli predykcyjnych.
  • Wszystko przećwiczysz w praktyce na komputerze.
  • Otrzymasz obszerne materiały umożliwiające samodzielną późniejszą pracę, w tym skrypty R.


Dla kogo jest to szkolenie?

Pracownicy departamentów zajmujących się analizą danych i modelowaniem (CRM, ryzyko kredytowe), departamentów controllingu, audytu, IT oraz innych:

  • potrzebujący analizować dane,
  • chcący odkrywać zależności w danych,
  • budujący modele predykcyjne.


Skrót programu szkolenia

  • Wprowadzenie do data miningu i jego zadania
  • Przygotowanie danych do analizy
  • Przegląd metod data miningu
  • Wybrane metody wizualizacji i eksploracyjna analiza danych
  • Wybór najlepszych cech i optymalnego modelu/algorytmu
  • Prowadzenie projektów eksploracji danych
  • Case studies


Program szkolenia

  1. Wprowadzenie do data miningu
    • czym jest data mining (DM)?
    • przegląd zastosowań DM: zastosowania w bankowości i w przemyśle, text mining, web mining
    • data mining z punktu widzenia potrzeb biznesowych firmy: analiza klientów i ich zachowania, CRM, wspomaganie podejmowania decyzji, możliwe korzyści
    • główne etapy w procesie odkrywania wiedzy w danych (Knowledge Discovery in Data)
    • różnice pomiędzy DM, OLAP i analizą wyników zapytań bazodanowych
    • DM a statystyka
  2. Przegląd rodzajów zadań DM
    • klasyfikacja
    • analiza skupień
    • odkrywanie reguł asocjacyjnych
    • redukcja wymiaru
  3. Przygotowanie danych do analiz metodami data mining
    • analiza jakości danych
    • obserwacje brakujące i nietypowe
    • czyszczenie danych
    • przekształcenia wstępne
  4. Przegląd metod stosowanych w DM
    • klasyfikacja metod/algorytmów; uczenie z nadzorem i uczenie bez nadzoru
    • metody klasyfikacji (idea wielu metod, dokładniej: drzewa klasyfikacyjne, metoda najbliższego sąsiada (k-NN))
    • algorytmy analizy skupień (metoda k-średnich, PAM, metody hierarchiczne)
    • techniki redukcji wymiaru (metoda składowych głównych (PCA), skalowanie wielowymiarowe (MDS))
    • metody odkrywania reguł asocjacyjnych (algorytm apriori) oraz wizualizacja odkrytych reguł.
  5. Wybrane metody wizualizacji i eksploracyjna analiza danych (EDA)
    • analiza graficzna jednowymiarowa i wielowymiarowa
    • podstawowe wykresy analizy opisowej
    • zaawansowane algorytmy stosowane w wizualizacji danych wielowymiarowych
    • czym jest EDA?
    • metody stosowane w EDA
  6. Wybór najlepszych cech i optymalnego modelu/algorytmu
    • wybór istotnych cech (atrybutów)
    • ogólne reguły związane z wyborem modelu w praktyce
    • problem przeuczenia (overfitting)
    • kompromis pomiędzy złożonością struktury modelu, a jego efektywnością
    • ocena efektywności zastosowanej metody/algorytmu
    • podstawy oceny jakości modeli klasyfikacyjnych
    • podstawy oceny jakości analizy skupień
  7. Prowadzenie projektów DM
    • popularne metodologie prowadzenia projektów DM:
    • Virtuous Cycle of Data Mining
    • CRISP-DM
    • wskazówki praktyczne
  8. Case studies
    • przykłady typowych zadań DM na bazie wybranych problemów praktycznych
  9. Dyskusja: możliwe korzyści biznesowe związane z zastosowaniem analiz data mining
    • dyskusja z uczestnikami szkolenia na temat przydatności i możliwości zastosowanie metod data miningu w analizie problemów spotykanych w ich praktyce zawodowej

Spróbuj ponownie