Szkolenie

Analiza danych,

Text mining w języku Python

Prowadzący: Adam Radziszewski,

Program: poniżej

Rodzaj: Wewnętrzne

Czas trwania: 2-4 dni

Szkolenie wewnętrzne: Zakres i termin do ustalenia. Grupy już od trzech osób.


Mogą cię zainteresować: Machine Learning w R — warsztat, Text mining w praktyce z wykorzystaniem R,


 
 

Dokumenty tekstowe, informacje z rozmów z klientami kontaktującymi się z call center, emaile, zgłoszenia problemów z urządzeniami lub usługami, zawartość blogów, opinie o produktach w internecie, inne opinie klientów itd. W takich danych jest bardzo dużo przydatnych informacji. Nauczymy Cię jak je analizować i wykorzystywać wyniki takich analiz. Metody text mining pozwolą wykrywać tkwiące w danych informacje niezbędne do rozwoju Twojej firmy.

Poza prostą eksploracją danych tesktowych, dowiesz się jak wykorzystać zaawansowane techniki machine learningowe do analizy tekstów. Poznasz różnicę między sposobem analizowania polskich i angielskich dokumentów. Szkolenie prezentujemy z wykorzystaniem języka Python. Otrzymasz dużo materiałów oraz kodów do analizy.


Czego się nauczysz?

  • Obsługi środowiska Jupiter
  • Pisać własne skrypty w Python
  • Jak zacząć analizę poprzez wstępne przygotowania danych tekstowych
  • Wychwytywać potencjał w danych poprzez proste operacje na tekście
  • Wyliczać rozbudowane statystyki z danych tekstowych
  • Wyszukiwać informacji w danych tekstowych
  • Wykorzystać machine learning w text miningu
  • Analizować emocje zawarte w tekście


Dla kogo jest to szkolenie?

Pracownicy departamentów zajmujących się:

  • analizą danych i modelowaniem statystycznym
  • business intelligence
  • oraz innych chcących pogłębić praktyczne umiejętności w analizie tekstu


Skrót programu szkolenia

  • Podstawy środowiska Jupiter
  • Użycie języka programowania Python
  • Text mining i jego zastosowania
  • Analiza języka polskiego i angielskiego
  • Machine learning a text mining
  • Odnajdywanie emocji w tekście


WordPress database error: [You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ORDER BY sortorder' at line 1]
SELECT * FROM wp_ngg_pictures WHERE galleryid = ORDER BY sortorder

Program szkolenia

  1. Wprowadzenie do interaktywnego środowiska obliczeń Jupyter.
    • Uruchomienie środowiska, utworzenie przykładowych notebooków, poruszanie się po środowisku.
    • Idea środowiska.
    • Tworzenie powtarzalnych eksperymentów, dzielenie się wynikami, dokumentacja eksperymentu.
  2. Elementy języka Python.
    • Interpreter, wyrażenia, zmienne, funkcje. Zasięg zmiennych.
    • Czym się różni obiekt od klasy. Często spotykane komunikaty błędów.
    • Ćwiczenia praktyczne.
  3. Proste operacje na tekście.
    • Wyrażenia regularne.
    • Ćwiczenia praktyczne.
  4. Przetwarzanie języka naturalnego
    • Text mining — cele, możliwości, ograniczenia. Krótkie wprowadzenie.
    • Przegląd wybranych pakietów oprogramowania.
  5. Wstępne przygotowanie tekstu do obróbki

  6. Wprowadzenie do pakietu NLTK.

  7. Wstępna analiza tekstu
    • Uzyskanie podstawowych statystyk (liczby słów, zdań, listy frekwencyjne słów)
    • Części mowy, rdzenie i lematy.
    • Pisanie prostych skryptów w języku Python.
  8. Obróbka tekstu polskiego a angielskiego
    • Teoretyczne i praktyczne różnice.
    • Częstość form i lematów w języku polskim.
    • Ćwiczenia praktyczne.
  9. Uczenie maszynowe
    • Uczenie z nadzorem a grupowanie.
    • Klasyfikacja dokumentów według treści na podstawie dokumentów wzorcowych.
    • Przykłady i ćwiczenia praktyczne.
    • Opcjonalnie: automatyczne grupowanie dokumentów (bez wzorca) na podstawie treści przy użyciu pakietu scikits.learn.
  10. Analiza nastawienia emocjonalnego tekstu.
    • Wyjaśnienie trudności zadanie
    • Kiedy mamy szanse uzyskać sensowny wynik.
    • Uczenie na tekstach wzorcowych, analiza nieznanych tekstów.
    • Ćwiczenia praktyczne

Spróbuj ponownie