11 października 2022
Post
Używanie określenia „data science” jest szkodliwe.
Oto dlaczego tak uważam:
- Jest on bardzo ogólny, bez precyzyjnej definicji. Każdy może nazywać siebie data scientistem. Wiele osób przemianowało się na naukowców zajmujących się danymi bez odpowiedniego przygotowania, wykształcenia i doświadczenia.
- „Nauka” sugeruje stosowanie metod naukowych. Zwiększa to wiarę, że wyniki są poprawne. W praktyce jest to raczej podejście partyzanckie 😉
- Nowa nazwa dla starej rzeczy oznacza, że jest to coś nowego. Sugeruje, że potrzebne są nowe narzędzia i umiejętności. Nieprawda. Nadal używa się algorytmu k-średnich, który ma ponad 60 lat. Modelowanie matematyczne jest używane od dziesięcioleci. Decyzje oparte na danych wykorzystywane są podobnie długo.
- Definicja sugeruje, że data scientist musi znać wszystko bardzo dobrze, np. matematykę, statystykę, programowanie, wizualizację danych itp. Nie jest to możliwe. Mimo to ludzie zakładają, że ktoś posługujący się tym tytułem wie wszystko.
- To coś zupełnie nowego. Data scientiści robią magiczne rzeczy za pomocą nowych narzędzi. Wzmacnia to wiarę w magię i w to, że rzeczy dzieją się same
- Zawód ten został przedstawiony jako coś nowego i atrakcyjnego. To przyciągnęło nowych ludzi do tej dziedziny. Jest to zawód podobny do wielu innych. Istnieją nudne zadania, jest wiele niepowodzeń i trudne (lub niemożliwe) wyzwania. Rozpoczęcie pracy w data science może być rozczarowujące.
- Na koniec, określenie nie jest to nawet logicznie poprawne. To nie jest nauka, której przedmiotem zainteresowania są dane.
Dodatkowo spójrz na listę „gorących tematów” z dziedziny data science, od najstarszych (spisane z pamięci), wśród których jest sporo absurdów:
- Najbardziej seksowna praca XXI wieku.
- Wiele prób zdefiniowania tego określenia i burzliwe dyskusje na temat definicji.
- Listy tego, co trzeba wiedzieć, aby zostać data scientistem.
- Obietnice, że zostaniesz nim w ciągu miesiąca.
- Data scientiści to jednorożce. Oni nie istnieją. W końcu zrozumienie, że istnieje więcej specjalizacji i potrzeba więcej osób niż tylko jedna.
- Zaczęła pojawiać się logika i zdrowy rozsądek: Nie chodzi tylko o narzędzia. Zrozumienie biznesu i umiejętności rozwiązywania problemów są bardzo ważne.
- ChatGPT zastąpi data scientistów 😉
- ChatGPT nie zastąpi data scientistów 😉