Często słyszymy od naszych potencjalnych klientów: „Weź ten zbiór danych i zrób nam PoC w dwa tygodnie”.

Czy to właściwe podejście do PoC?

Zdecydowanie nie!

Inne nazwy tego podejścia to:

  • nieinformatywny eksperyment,
  • przepis na katastrofę,
  • spalanie pieniędzy,
  • kosztowne i bezużyteczne ćwiczenie matematyczne.

Dlaczego?

To, co powinieneś zrobić w PoC wykorzystującym metody matematyczne (potocznie, metody data science / machine learning / AI), to
sprawdzić, czy możliwe jest osiągnięcie celu biznesowego za pomocą odpowiednio dobranych metod metod matematycznych.

Dlaczego miałoby wystarczyć wzięcie zbioru danych i zbudowanie modelu? A co tak naprawdę trzeba zrobić?

  • zrozumieć cel biznesowy,
  • mając na uwadze ograniczenia i trudności,
  • bardzo precyzyjne określić cel biznesowy,
  • przetłumaczenie tego celu na język matematyki (nie tracąc zbyt wiele w tłumaczeniu),
  • przygotować odpowiednie dane, zrozumieć je i sprawdzić ich poprawność,
  • zbudować rozwiązanie matematyczne i zawierające je rozwiązanie informatyczne,
  • zintegrować rozwiązanie z systemem produkcyjnym,
  • zmierzyć jego efektywność, najlepiej w jednostkach pieniężnych.

Oznacza to, że zbyt lekkie podejście, tj. pominięcie zbyt wielu punktów z listy, nie rozwiąże właściwego problemu. Oznacza to, że ten PoC nie da nam odpowiedzi na właściwe pytanie.

Co można uprościć w PoC?

  • wybrać tylko pewną specyficzną częścć populacji, do której chcemy zastosować ML / AI,
  • wykorzystać ograniczony zbiór danych o niższym koszcie przygotowania, np. posiadający mniejszą liczbę cech,
  • skrócić czas poświęcony na wstępną analizę danych,
  • zastosować tylko podstawowe metody matematyczne,
  • dokonać prostej integracji rozwiązania albo nie integrować go w ogóle,
  • zmniejszyć efektywność rozwiązania, tj. brak przetwarzania w czasie rzeczywistym, długi czas odpowiedzi, pominąć load balancing,
  • uprościć pomiar efektywności rozwiązania.