System operacyjny GNU/Linux wraz z narzędziami Open Source jest zestawem oferującym bardzo dużo możliwości również w dziedzinie Data Science.

Ważne jest, że w systemie Linux analiza danych z wykorzystaniem wolnego i otwartego oprogramowania jest dużo łatwiejsza i bardziej efektywna, niż w systemie Windows. Podobnie, automatyzacja analiz i czyszczenia danych różnych rodzajów też jest dużo wygodniejsza.

Mimo, iż wspomniany system i oprogramowanie są dystrybuowane za darmo, stanowią jakość z najwyższej półki. Początkowo używanie tego systemu może wydawać się skomplikowane. Dlatego przygotowaliśmy to szkolenie.

Wybrana przez nas dystrybucja Debian Wheezy została przygotowana i przetestowana pod względem maksymalnej stabilności. Drugim atutem tej dystrybucji jest łatwość w zarządzaniu oprogramowaniem. Wraz z długoterminowym wsparciem Debian stanowi solidną bazę do prowadzenia komercyjnych oraz badawczych projektów Data Science.

Dzięki szkoleniu osoba, która nigdy nie miała styczności z Linuksem, będzie mogła swobodnie z nim pracować. Zaprezentujemy również dobre praktyki oraz praktyczne wskazówki, dzięki którym praca będzie wygodna i efektywna.

Szkolenie można oczywiście uzupełnić naszymi warsztatami z RPythona oraz dobrego programowania oraz szkoleniami z analizy danych.

Czego się nauczysz?

  • Instalacji Debiana Wheezy z uwzględnieniem szyfrowania (dm-crypt)
  • ,,Poruszania się” w systemie za pomocą interfejsu graficznego oraz terminala
  • Pisania prostych skryptów w BASHu z wykorzystaniem narzędzi takich jak grep, sed, awk
  • Instalacji oprogramowania z oficjalnych repozytoriów Debiana oraz dodawanie innych repozytoriów
  • Kompilacji i ,,ręcznej” instalacji oprogramowania
  • Prostej metody backupów (deja-dup), kontroli wersji (git), oraz pracy zdalnej (SSH/MOSH)
  • Identyfikacji wersji używanego oprogramowania oraz wyszukiwania interesujących pakietów przydatnych przy uprawianiu data science

Dla kogo jest to szkolenie?

Wszyscy, którzy mają do czynienia z analizą danych i modelowaniem, którzy:

  • chcą zacząć pracować w środowisku Linux,
  • są zainteresowani wzbogaceniem swoich umiejętności korzystania z narzędzi open source,
  • zostali zmuszeni aby używać ,,tego linuksa”,
  • chcieliby przetestować darmowe narzędzia open source używane w data science.

Skrót programu szkolenia

  • Instalacja systemu Debian Wheezy
  • Środowisko graficzne Gnome 3
  • Terminal tekstowy
  • Repozytoria, pakiety i instalacja
  • Skrypty BASH i podstawowe narzędzia
  • System kontroli wersji
  • Backupy
  • Praca zdalna
  • Selekcja oprogramowania z oficjalnych repozytoriów Debiana
  • Ręczna kompilacja i instalacja oprogramowania spoza repozytoriów

WordPress database error: [You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'ORDER BY sortorder' at line 1]
SELECT * FROM wp_ngg_pictures WHERE galleryid = ORDER BY sortorder

Program szkolenia

  1. Instalacja systemu Debian Wheezy
    • Przeprowadzenie instalacji systemu
    • Omówienie zalet i wad systemu Debian
    • Charakterystyka systemu partycji i plików
    • Wyjaśnienie idei szyfrowania
  2. Środowisko graficzne Gnome 3
    • Demonstracja możliwości
    • Przedstawienie wskazówek odnośnie użytkowania
  3. Terminal tekstowy
    • Omówienie podstawowych komend
    • Tips and Tricks
  4. Repozytoria, pakiety i instalacja
    • Aktualizacja systemu
    • Instalowanie programów z repozytoriów
    • Zarządzanie repozytoriami
  5. Skrypty BASH i podstawowe narzędzia
    • Dlaczego warto pisać skrypty
    • awk, grep, sed, czyli bardzo proste i przydatne programiki
    • Przykład pracy z surowymi danymi, czyli użycie podstawowych narzędzi do przygotowania danych
  6. System kontroli wersji
    • Dlaczego powinno używać się systemów kontroli wersji
    • Przykład użycia
  7. Backupy
    • Omówienie zagadnienia
    • Konfiguracja programu
  8. Praca zdalna
    • SSH jako standardowe narzędzie pracy każdego mobilnego linuksowca
    • MOSH jako lepszy SSH
    • SCP – czyli jak skopiować dane z „komputera biurkowego” na „laptopa terenowego”
    • Omówienie programu Byoubu
  9. Selekcja oprogramowania z oficjalnych repozytoriów Debiana
    • Omówienie poszczególnych programów — GNU R, Python i SciPy/Sickit, Octave, Weka
    • Wskazanie wersji dostępnych w repozytorium
  10. Ręczna kompilacja i instalacja oprogramowania spoza repozytoriów
    • Dodatkowe pakiety dla R i moduły dla Pythona
    • Repozytorium Cloudera i Hadoop
    • Przykład ręcznej kompilacji

Spróbuj ponownie