Szeregi czasowe to ważny rodzaj danych, spotykany w wielu obszarach zastosowań. Przykładem są dane finansowe i ekonomiczne, szeregi czasowe związane z prognozowaniem sprzedaży, planowaniem produkcji, czy też dane gromadzone podczas monitorowania pracy maszyn i urządzeń.

Analiza takich danych wymaga uwzględnienia ich specyfiki, zwłaszcza występujących (pomiędzy kolejnymi wartościami) korelacji/zależności czasowych. Szereg czasowy traktowany jest w analizie eksploracyjnej często jako całość, a nie jak zbiór (wektor) wartości.

Tak jak w przypadku innych danych, analiza eksploracyjna (data mining) szeregów obejmuje zwykle kilka etapów pozwalających na wydobycie z danych użytecznych informacji. Do typowych zadań analizy eksploracyjnej zaliczamy m.in.: wizualizację, analizę podobieństwa i grupowanie szeregów oraz konstrukcję reguł klasyfikacyjnych. Odrębnym i ważnym zagadnieniem jest również wykrywanie anomalii w analizowanych danych.

Wiele rzeczywistych szeregów czasowych to duże i często zmieniające się dane. W analizie szeregów ważna jest wobec tego efektywna reprezentacja danych. Oznacza to, że często konieczna jest ekstrakcja najważniejszych cech (charakterystyk), dzięki której możliwa będzie znaczna redukcja rozmiaru danych oraz zwiększenie efektywności metod analitycznych. Często stosowanym w tym celu rozwiązaniem jest też segmentacja (podział szeregu na jednorodne segmenty) lub wstępna redukcja wymiaru (zmniejszenie liczby analizowanych szeregów do kilku reprezentatywnych składowych/wymiarów).

Jak odpowiednio przygotować/przekształcić dane przed właściwą analizą? Jaką metodę reprezentacji szeregów zastosować, aby zredukować wymiar danych, zachowując ich najważniejsze własności? Jak znaleźć szeregi, które są do siebie najbardziej podobne? W jaki sposób wykryć nieregularne/nietypowe zachowanie w danych i uwzględnić je w analizie?

Podczas naszego szkolenia poznasz odpowiedzi na te i podobne pytania. Możliwe jest także dostosowanie programu szkoleniu do indywidualnych potrzeb. Na przykład program szkolenia może być rozszerzony o zagadnienia z klasycznej analizy szeregów czasowych (dopasowanie modeli, prognozowanie, itp.).

Czego się nauczysz?

  • Nauczysz się znajdować przydatne zależności i relacje między danymi zależnymi od czasu.
  • Dowiesz się, jak analizować dziesiątki, a nawet setki szeregów czasowych równocześnie.
  • Dowiesz się jak odpowiednio przygotować dane do dalszej analizy i jak uwzględnić w analizie ich dodatkowe własności.
  • Nauczysz się jak efektywnie reprezentować analizowane dane, wykorzystując algorytmy segmentacji, ekstrakcji cech i redukcji wymiaru.
  • Poznasz klasyczne i nowoczesne metody analizy eksploracyjnej szeregów.
  • Nauczysz się jak wybrać i zastosować optymalne algorytmy analizy skupień, klasyfikacji i redukcji wymiaru.
  • Dowiesz się jak wykryć anomalie występujące w analizowanych danych.
  • Wszystko przećwiczysz w praktyce na komputerze: używamy systemu R,
  • Otrzymasz obszerne materiały umożliwiające samodzielną późniejszą pracę.

Dla kogo jest to szkolenie?

  • Analitycy zatrudnieni w zespołach badawczo-rozwojowych zakładów przemysłowych, instytucji finansowych, firm telekomunikacyjnych, software’owych i innych.
  • Pracownicy departamentów analiz ekonomicznych, controllingu, sprzedaży, marketingu i innych
  • Osoby analizujące zachowanie szeregów czasowych związanych z ekonomią, przemysłem, produkcją, sprzedażą, itp.
  • Osoby zainteresowane stosowaniem klasycznych i nowoczesnych metod analizy eksploracyjnej szeregów czasowych.
  • Wszyscy zainteresowani poznaniem sposobów wykrywania i uwzględnienia w analizie nieregularnych zachowań (anomalii) występujących w szeregach czasowych.

Skrót programu szkolenia

  • Wprowadzenie do analizy eksploracyjnej szeregów czasowych
  • Wizualizacja szeregów czasowych
  • Podstawowe przekształcenia szeregów
  • Podstawowe własności szeregów i ich identyfikacja
  • Mierzenie podobieństwa szeregów
  • Grupowanie i klasyfikacja szeregów
  • Redukcja wymiaru
  • Segmentacja szeregów czasowych
  • Wykrywanie anomalii w szeregach czasowych

WordPress database error: [You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ORDER BY sortorder' at line 1]
SELECT * FROM wp_ngg_pictures WHERE galleryid = ORDER BY sortorder

Program szkolenia

  1. Wprowadzenie do analizy eksploracyjnej szeregów czasowych
    • Przykłady szeregów czasowych z różnych obszarów zastosowań (ekonomia i finanse, przemysł, inne)
    • Specyfika analizy szeregów czasowych: wymiarowość danych, zależność/korelacja czasowa, itd.
    • Typowe zadania analizy eksploracyjnej — przykłady
  2. Wizualizacja szeregów czasowych
    • Wykres szeregu czasowego i jego interpretacja
    • Wykresy zwykłe i sezonowe
    • Wykresy panelowe
    • Wizualizacja wielowymiarowych szeregów czasowych
    • Wykresy typu ‚heatmap’
  3. Podstawowe przekształcenia szeregów
    • Transformacje potęgowe
    • Przekształcenia związane z układem kalendarza
    • Różnicowanie
    • Usuwanie trendu i sezonowości
    • Wygładzanie danych (metody ruchomej średniej)
    • Normalizacja i skalowanie
    • Inne przekształcenia
  4. Podstawowe własności szeregów i ich identyfikacja
    • Charakteryzacja podstawowych cech szeregów: statystyki opisowe i badanie rozkładu danych
    • Identyfikacja regularnych wzorców (tendencji długoterminowych, zachowań okresowych, itp.)
    • Analiza zależności czasowej danych — funkcje autokorelacji (ACF) i cząstkowej autokorelacji (PACF)
    • Szeregi stacjonarne i niestacjonarne — podstawowe własności i wybrane modele
    • Ekstrakcja najważniejszych charakterystyk (cech) z szeregów czasowych
      • potrzeba efektywnej reprezentacji danych
      • przegląd metod stosowanych do ekstrakcji cech
      • zalecenia dotyczące wyboru optymalnej metody ekstrakcji
    • Przykłady: Analiza wybranych rzeczywistych szeregów czasowych
  5. Analiza podobieństwa szeregów czasowych
    • Możliwe zastosowania miar podobieństwa/odległości szeregów w analizie eksploracyjnej
    • Specyfika podobieństwa między szeregami — ograniczenia klasycznych metod i konieczność stosowania dedykowanych rozwiązań
    • Wybrane miary podobieństwa/odległości dla szeregów czasowych
      • odległość korelacyjna
      • odległości bazujące na korelacji czasowej (funkcja ACF i PACF)
      • odległości oparte na klasycznych modelach statystycznych (model-based)
      • Dynamic Time Warping (DTW) i Derivative Dynamic Time Warping (DDTW)
      • inne
    • Mierzenie podobieństwa a przekształcenia wstępne szeregów
    • Uwzględnienie stopnia złożoności w analizie podobieństwa (Complexity Invariant Distance)
    • Zalecenia dotyczące wyboru odpowiedniej miary podobieństwa/odległości
  6. Grupowanie i klasyfikacja szeregów
    • Wprowadzenie do analizy skupień (grupowania)
      • idea i etapy w analizie skupień
      • wybrane algorytmy: metody grupujące i hierarchiczne
      • wizualizacja i ocena wyników grupowania
    • Wprowadzenie do klasyfikacji
      • idea i cel klasyfikacji
      • wybrane algorytmy: metoda najbliższego sąsiada (k-nn), drzewa klasyfikacyjne, inne
      • ocena dokładności klasyfikacji
    • Case studies: zastosowanie wybranych metod klasyfikacji dla wybranych danych rzeczywistych
  7. Redukcja wymiaru
    • Problem wielowymiarowości w przypadku szeregów czasowych
    • Typowe zastosowania redukcji wymiaru
    • Wybrane algorytmy i ich własności
      • skalowanie wielowymiarowe (MDS)
      • analiza składowych głównych (PCA)
      • analiza kanoniczna
    • Przykłady: Zastosowania redukcji wymiaru w analizie eksploracyjnej szeregów czasowych
  8. Segmentacja szeregów czasowych
    • Cel i korzyści ze stosowania segmentacji
    • Wybrane metody stosowane do segmentacji szeregów
      • metoda przesuwnego okna (slidding window)
      • algorytmy top-downbottom-up
      • inne
    • Przykłady zastosowania segmentacji na bazie wybranych danych rzeczywistych
  9. Wykrywanie anomalii w szeregach czasowych
    • Przykłady anomalii występujących w rzeczywistych szeregach czasowych
    • Rodzaje obserwacji odstających (outliers) w szeregach czasowych i ich identyfikacja w praktyce
    • Wykrywanie anomalnych (odmiennych) sekwencji w szeregu (time series discords)
    • Wykrywanie punktów zmiany w szeregach (changepoint analysis)
      • zmiany dotyczące średniej (poziomu) oraz wariancji (zmienności) szeregu
      • zmiany pojedyncze i wielokrotne
    • Case study: wykrywanie anomalii w wybranych danych rzeczywistych

Spróbuj ponownie