Żyjemy w epoce ogromnych zbiorów danych. Stale rośnie znaczenie tego, jakie dane posiadasz i jaką wiedzę potrafisz z nich na bieżąco wydobywać w perspektywie procesów decyzyjnych. Ma to istotny wpływ na efektywność funkcjonowania i rozwoju Twojej firmy.

Metody Machine Learning to algorytmiczne systemy uczące się, umożliwiające identyfikację użytecznych wzorców obecnych w danych oraz wykorzystanie pozyskanej wiedzy do optymalizacji podejmowania decyzji. Wdrożenie metod ML w strategię działania firmy, pozwala w jawny i szybki sposób przyczynić się zwiększenia jej zysków.

Na szkoleniu poznasz podstawy teoretyczne, ale przede wszystkim zobaczysz metody ML w działaniu. Jeśli masz opory co do użycia "niewytłumaczalnych" modeli typu black-box, pokażemy Ci jak w klarowny sposób je interpretować i przenieść na działanie biznesu. Orientacja na praktykę uzasadnia wykorzystanie systemu R. Dla R dostępne jest cały zestaw bibliotek dedykowanych Machine Learning, aktywnie rozwijanych przez wybitnych specjalistów związanych z tą dziedziną.


Czego się nauczysz?

  • Poznasz istotę działania Machine Learning (ML).
  • Dowiesz się, jakie możliwości stwarza ML.
  • Uzyskasz wiedzę, jak przygotować dane pod kątem zastosowań ML.
  • Poznasz konkretne metody ML np. xgboost lub svm.
  • Nauczysz się oceniać i porównywać jakość systemów uzyskanych za ich pomocą.
  • Zapoznasz się z prostymi technikami interpretacji modeli black-box.
  • Pozyskasz wiedzę o praktycznych stronach organizacji procesu konstrukcji i wykorzystania systemów ML.
  • Wszystkie ćwiczenia będziesz mógł zrealizować na komputerze.
  • Otrzymasz obszerne materiały umożliwiające samodzielną późniejszą pracę (skrypty R).


Dla kogo jest to szkolenie?

Wykwalifikowana kadra używająca zaawansowanych technik ML wpływa na istotne zwiększenie zysków oraz rangi firmy na rynku. Przekonamy Cię, że efektywne posługiwanie się metodami ML nie jest tylko dla wąskiej grupy osób, ale dla każdego zajmującego się analizą danych i modelowaniem (CRM, ryzyko kredytowe), pracowników z departamentów controllingu, audytu, IT oraz innych:

  • potrzebujących analizować dane,
  • chcących odkrywać zależności w danych,
  • budujących modele predykcyjne.


Skrót programu szkolenia

  • Drzewa decyzyjne
  • Ensemble learning
  • Maszyny wektorów nośnych (SVM)
  • Sztuczne sieci neuronowe i podstawy Deep Learning
  • Uczenie bez nadzoru
  • Praktyczne kwestie związane z ML

WordPress database error: [You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ORDER BY sortorder' at line 1]
SELECT * FROM wp_ngg_pictures WHERE galleryid = ORDER BY sortorder


Program szkolenia

  1. Wprowadzenie
    • istota metod Machine Learning i dlaczego je stosować?
    • relacje między ML, statystyką i teorią sztucznej inteligencji
    • porównanie jakości modeli ML oraz statystycznych
    • typowe i nietypowe problemy rozwiązywane za pomocą ML
    • kryteria klasyfikacji problemów i metod ML:
      • uczenie pod nadzorem, bez nadzoru, z częściowym nadzorem
      • typy algorytmów: batch learning, incremental learning
  2. Uczenie nadzorowane — uwagi ogólne
    • techniki wyboru i oceny algorytmów uczenia pod nadzorem w przypadku klasyfikacji i regresji
    • problem ,,przeuczenia” modelu
    • problemy obciążenia i wariancji
    • Curse of Dimensionality
  3. Przetwarzanie danych w R
    • wprowadzenie do środowiska R
    • wczytywanie danych z różnych źródeł
    • eksploracja danych
    • metody standaryzacji i dyskretyzacji cech
    • techniki wyboru cech istotnych
    • obsługa braków danych i wartości odstających
    • wizualizacja danych
  1. Drzewa decyzyjne
    • uczenie, przycinanie i testowanie drzew decyzyjnych
    • budowa drzew klasyfikacyjnych z niesymetryczną funkcją straty
    • badanie stabilności drzew
    • zalety i wady drzew decyzyjnych
  1. Ensemble learning
    • idea łączenia modeli
    • Bagging
    • Boosting (algorytm ADAboost)
    • gradient Boosting (algorytm XGboost)
    • lasy losowe
    • wizualizacja i interpretacja wyników lasu losowego przy pomocy pakietu randomForestExplainer
  1. Maszyny wektorów nośnych (SVM)
    • liniowe i nieliniowe SVM
    • wybór funkcji jądrowych i tuning parametrów
    • Relevance Vector Machines
    • wady i zalety metod opartych na wektorach nośnych
  1. Sztuczne sieci neuronowe i podstawy Deep Learning
    • rodzaje architektury sieci neuronowych
    • kryteria doboru architektury i parametrów modelu adekwatnych do rozpatrywanego problemu
    • wprowadzenie do Deep Learning
    • interpretacja wyników
    • zalety i wady sztucznych sieci neuronowych
  1. Uczenie bez nadzoru
    • Principal Component Analysis (PCA)
    • Analiza skupień (clustering)
    • metody hierarchiczne
    • metoda K-średnich
    • podejście modelowe
    • wybór cech
    • wybór miar odległości między obiektami
    • ocena wyników analizy skupień
  1. Praktyczne kwestie związane z ML
    • interpretacja modeli black box
    • praca z dużymi zbiorami danych
    • kwestie wydajnościowe
    • obliczenia równolegle w R
    • dyskusja z uczestnikami

Spróbuj ponownie