Często słyszymy od naszych potencjalnych klientów: „Weź ten zbiór danych i zrób nam PoC w dwa tygodnie”.
Czy to właściwe podejście do PoC?
Zdecydowanie nie!
Inne nazwy tego podejścia to:
- nieinformatywny eksperyment,
- przepis na katastrofę,
- spalanie pieniędzy,
- kosztowne i bezużyteczne ćwiczenie matematyczne.
Dlaczego?
To, co powinieneś zrobić w PoC wykorzystującym metody matematyczne (potocznie, metody data science / machine learning / AI), to
sprawdzić, czy możliwe jest osiągnięcie celu biznesowego za pomocą odpowiednio dobranych metod metod matematycznych.
Dlaczego miałoby wystarczyć wzięcie zbioru danych i zbudowanie modelu? A co tak naprawdę trzeba zrobić?
- zrozumieć cel biznesowy,
- mając na uwadze ograniczenia i trudności,
- bardzo precyzyjne określić cel biznesowy,
- przetłumaczenie tego celu na język matematyki (nie tracąc zbyt wiele w tłumaczeniu),
- przygotować odpowiednie dane, zrozumieć je i sprawdzić ich poprawność,
- zbudować rozwiązanie matematyczne i zawierające je rozwiązanie informatyczne,
- zintegrować rozwiązanie z systemem produkcyjnym,
- zmierzyć jego efektywność, najlepiej w jednostkach pieniężnych.
Oznacza to, że zbyt lekkie podejście, tj. pominięcie zbyt wielu punktów z listy, nie rozwiąże właściwego problemu. Oznacza to, że ten PoC nie da nam odpowiedzi na właściwe pytanie.
Co można uprościć w PoC?
- wybrać tylko pewną specyficzną częścć populacji, do której chcemy zastosować ML / AI,
- wykorzystać ograniczony zbiór danych o niższym koszcie przygotowania, np. posiadający mniejszą liczbę cech,
- skrócić czas poświęcony na wstępną analizę danych,
- zastosować tylko podstawowe metody matematyczne,
- dokonać prostej integracji rozwiązania albo nie integrować go w ogóle,
- zmniejszyć efektywność rozwiązania, tj. brak przetwarzania w czasie rzeczywistym, długi czas odpowiedzi, pominąć load balancing,
- uprościć pomiar efektywności rozwiązania.