Praktyczne modelowanie statystyczne to coś zupełnie innego niż zabawa z prostymi danymi. Konieczne jest dobre przygotowanie danych, umiejętne wybranie zmiennych oraz poradzenie sobie z problemami zawsze spotykanymi w praktyce. Rozwiązania tych problemów bardzo rzadko opisywane są w książkach czy prezentowane na wykładach.

Oczywiście, stosuje się metody klasyczne, na przykład regresję liniową czy regresję logistyczną. Oprócz tych metod jest wiele metod nowoczesnych, które pomagają zbudować lepsze modele.

Podczas szkolenia będziesz pracować nad ciekawymi rzeczywistymi zagadnieniami na prawdziwych danych. Poznasz klasyczne i nowoczesne modele statystyczne.

Po szkoleniu będziesz wiedzieć, jak wybrać i przygotować dane, dobrać odpowiedni rodzaj modelu do Twojego zagadnienia oraz jak ocenić jakość modelu.


Czego się nauczysz?

  • Po szkoleniu będziesz w stanie zbudować model statystyczny. Nawet, jeśli zaczniesz szkolenie bez wiedzy z tej dziedziny.
  • Poznasz wszystkie etapy procesu budowy modelu statystycznego: od zebrania danych, poprzez wybór cech i rozpoznanie ich właściwości niezbędnych do zbudowania modelu, ocenę jakości modelu oraz wskazanie danych krytycznych dla jakości modelu.
  • Nauczysz się przygotowywać dane do budowy modeli statystycznych.
  • Nauczysz się dobierać skalę danych i eliminować zmienne zbędne.
  • Poznasz różne kryteria oceny jakości modelu i nauczysz się wybierać optymalne modele dla swoich danych.
  • Poznasz niestandardowe modele statystyczne.
  • Wszystko przećwiczysz w praktyce na komputerze: używamy systemu RRStudio.
  • Otrzymasz materiały umożliwiające samodzielną późniejszą pracę, w tym skrypty R.


Dla kogo jest to szkolenie?

Osoby zajmujące się modelowaniem i analizą danych praktycznie we wszystkich instytucjach, komercyjnych i naukowych:

  • zainteresowani analizą danych ułatwiającą wybór modelu statystycznego,
  • potrzebujący narzędzia umożliwiającego prognozy oraz ustalenie istotnych relacji między danymi.
  • chcący poznać modele danych występujących w specyficznych obszarach zainteresowań słuchaczy (ekonomia, medycyna, nauki społeczne, doświadczalnictwo i inne)


Skrót programu szkolenia

  • Wprowadzenie do modelowania statystycznego
  • Modele liniowe
  • Analiza kanoniczna
  • Uogólnione modele liniowe
  • Niestandardowe modele statystyczne
  • Modele addytywne
  • Drzewa regresyjne


Program szkolenia

  1. Wprowadzenie do modelowania statystycznego
    • Klasyfikacja modeli statystycznych
    • Preprocesing danych
      • Skalowanie danych, transformacje Boxa-Coxa
      • Usuwanie i dodawanie zmiennych
      • Rozkłady danych
    • Weryfikacja modelu
      • Kroswalidacja
      • Wybór spośród wielu modeli
  2. Modele liniowe
    • Założenia teoretyczne
    • Budowa modelu
    • Diagnostyka regresji
    • Wybór zmiennych w regresji
    • Regresja składowych głównych
    • Modele z funkcją kary
    • Regresja grzbietowa
    • Lasso i sieci elastyczne
  3. Analiza kanoniczna

  4. Uogólnione modele liniowe
    • Założenia teoretyczne
    • Regresja logistyczna
    • Regresja Poissona
    • Model Tweediego
    • Uogólnione modele liniowe spotykane w praktycznych zastosowaniach (modele danych ekstremalnych i inne)
  5. Niestandardowe modele statystyczne
    • Regresja splinami
    • Regresja kwantylowa
    • Regresja cząstkowa
  6. Modele addytywne
    • Funkcje wygładzające: lowess, spline
    • Estymacja modelu GAM
  7. Drzewa regresyjne
    • Klasyczne modele drzew regresyjnych
    • Optymalizacja drzew — bagging i boosting
    • Lasy losowe

Spróbuj ponownie