DataScience – Biznes Myśli

Metryki sukcesu w projektach Machine Learning

Vladimir — Mon, 14 Nov 2022 05:45:27 +0000

Dzisiaj porozmawiamy o metrykach sukcesu w projektach uczenia maszynowego.

Temat jest dosyć “gruby”, a więc nie oczekuj proszę, że znajdziesz tutaj odpowiedzi na wszystkie pytania… W zasadzie to nikt ich nie zna i zawsze można coś poprawiać i interpretować inaczej. Na tym polega rozwój i dlatego idziemy do przodu, ale aby w ogóle ruszyć z miejsca, szczególnie jeśli chodzi o projekt ML, to chcę dziś porozmawiać z Tobą na jeden z ważniejszych tematów w uczeniu maszynowym, temat od którego wszystko się zaczyna lub powinno zacząć, bo wciąż niestety zdarza się, że jest traktowany dosyć pobieżnie.

Postaram się odpowiedzieć w tym odcinku na takie pytania:

1. Co to są metryki sukcesu i dlaczego są podstępne?

2. Dlaczego biznesowe metryki sukcesu są takie ważne w projektach ML?

3. Jak biznesowe metryki sukcesu wpływają na techniczne?

4. Jakie pytania warto zadać rozmawiając o metrykach?

5. O częstych błędach popełnianych na tym etapie i ich wpływie na cały projekt?

Jestem człowiekiem, który zdecydowanie woli działać niż rozmawiać, ale jest taki moment w projekcie ML, zadaję pytania, słucham i rozmawiam. Czasem słyszę – “Dobra, to co działamy? Budujemy już ten model?” A wtedy bardzo często nie ma odpowiedzi na najważniejsze pytanie: ale co właściwie chcemy osiągnąć? Jaki jest nasz punkt B? I jak rozpoznamy (w sposób jednoznaczny), że go osiągnęliśmy?

I pierwsza myśl, która przychodzi do głowy – więcej sprzedawać, lepiej identyfikować klientów, lepiej wynajdować usterki. Jeśli operujemy takimi słowami, to z pewnością to nie brzmi jak metryka sukcesu dla ML… To stąd chce się zadać pytanie, co brzmi w takim razie jak metryka?

W sumie na to pytanie najlepiej odpowiedzieć od końca. Co powinno się stać, aby zauważyliśmy, że jest sukces (lub go nie ma)? Na co dokładnie będziemy patrzeć? I tu pojawia się szereg pomysłów, np. zwiększy się sprzedaż. Dobrze, ale kolejne pytanie w porównaniu z czym? Czyli wdrażamy model, mierzymy jaka jest sprzedaż i z czym porównujemy? Bo nie możemy porównać tak łatwo z którymś odcinkiem wstecz, bo tam był inny kontekst. Nawet jak uwzględnimy sezonowość i np. porównamy dokładnie rok wstecz, to nadal może być dość losowe porównania.

Dotarliśmy teraz do ważnego pojęcia, które nazywam “losowym porównaniem”. Co to oznacza? To oznacza, że istnieje milion rzeczy, które możemy porównywać, ale większość z nich niewiele nam coś daje oprócz tego, że porównamy coś z czymś i jest spora szansa, że wyciągniemy złe wnioski (chociaż może przez przypadek wyciągniemy też dobre wnioski, ale w takiej sytuacji też nie ma się co cieszyć z tego powodu – bo będziemy działać w złudzeniu, że wiemy co robimy.

I co teraz robić? No właśnie, mam nadzieje, że już trochę czujesz, że temat wcale nie jest taki trywialny, spróbujmy ugryźć tego słonia po kawałku.

Co to są metryki sukcesu i dlaczego są podstępne?

Co to znaczy metryka sukcesu

Metryka sukcesu to miara, którą śledzimy, aby wiedzieć, czy to co robimy ma sens, czy nasza strategia działania się sprawdza i czy dalej warto iść w tym kierunku. Brzmi pięknie i wydaje się to prosta rzecz, ale tak naprawdę kryje się tutaj dużo pułapek nawet nie wchodząc jeszcze na poziom ML.
Jeśli chodzi o takie podstawowe pytania, które warto sobie zadać, to czy mierzymy właściwe rzeczy i jeśli tak, to czy mierzymy je właściwie
W skrócie, metryka sukcesu jest po to, abyśmy nie przegapili sukcesu, ale też nie pomylili go z porażką.

Podstępność tego tematu polega też na tym, że czasem mierzymy pewne rzeczy, które wydają się ważne i są mierzone we właściwy sposób, ale de facto nic nie robimy z tym, bo np. nie mamy wpływu na zmianę procesu lub nie chcemy go zmieniać z innych powodów. I znajdujemy się w takiej ciekawej sytuacji, kiedy mamy wiedzę, że np. coś działa niezgodnie z naszymi oczekiwaniami, ale brak możliwych ruchów do wykonania, trudność zmian tej sytuacji itp. Takie sytuacje raczej zdarzają się w większych organizacjach, gdzie mamy pewne ugruntowane procesy, których zmiana wymaga znacznie więcej czasu niż np. w startupie, gdzie jest to decyzja jednej, dwóch osób. Dlaczego o tym mówię?

Właśnie po to, aby uczulić Cię jak ważnym i wielowymiarowym tematem są metryki sukcesu.
Fakt że są to już dobrze, ale jeśli decydujemy się inwestować pieniądze i czas w rozwój ML, to zdecydowanie ten temat wymaga przemyślenia przede wszystkim pod kątem biznesowym, a dopiero potem technicznym, bo jak się za chwilę dowiesz modele ML też mają swoje metryki sukcesu, które dobieramy dopiero wtedy, kiedy zrozumiemy te biznesowe, a nie odwrotnie.

Jak interpretować te słowa w kontekście modelu ML

No właśnie, co właściwie oznacza metryka sukcesu w kontekście projektu ML?

Budując model uczenia maszynowego też musimy narzucić mu pewne ramy i dokładnie określić, czego od niego oczekujemy sugerując się naszą potrzebą biznesową. Metryki sukcesu w ML są różne w zależności od wyzwania i celu biznesowego.

Podam Ci od razu przykład. Załóżmy, że mamy dwa modele, każdy z nich prognozuje to samo – odejście klientów (czyli tak zwany churn prediction). Jak to jest większa firma, to taki model jest uruchomiony dla tysiąca czy nawet miliona klientów, czyli dokładnie tyle oszacowań robi model. I teraz to, co chcemy zrobić, to zdecydować, który model radzi sobie lepiej.

W praktyce to oznacza, że jeśli mamy tysiące prognoz z modelu 1 i tyle samo z modelu 2, to chcemy jakoś skompresować te wartości do pojedynczej wartości. Dlaczego pojedynczej?, Bo wtedy człowiek może je łatwiej porównywać, bo porównać dwie grupy, które mają miliony czy nawet tysiące jest trudniejsze, niż porównać dwie pojedyncze wartości. Tylko coś za coś, w tym przypadku tracimy mnóstwo szczegółów, ale dostajemy łatwą możliwość porównać modele.

Metryka modelu ML, czasem jest nazywana też techniczną metryką. Inaczej mówiąc jest to to sposób przekształcania wszystkich prognozowanych wartości do pojedynczej wartości. Np. model prognozuje ceny nieruchomości, jedna z technicznych metryk, którą możemy zastosować to `mae`. W praktyce ta metryka robi kilka prostych kroków:

Dla każdej nieruchomości mamy parę: prawidłowa odpowiedź oraz prognozowana odpowiedź (np. 500 tys oraz 550 tys. )
Znajdujemy różnicę w prognozie, w tym przypadku 500 tys. – 550 tys. i mamy -50 tys. czyli model prognozował o 50 tys. więcej
Pozbywamy się znaku minusa (o ile on jest), chodzi o to, że w tej metryce jest wszystko jedno w którą stronę się pomyliłeś (czy o 50 za dużo, czy o 50 za mało)
Tak robimy dla każdej pary. Np. jak mamy 10k nieruchomości, to dostajemy 10k błędnych oszacowań
Na koniec dla wszystkich tych błędów znajdujemy wartość średnią.

To jest przykład, jak liczy się metryka modelu ML, tak jak już wspomniałem czasem nazywamy ją jako techniczna. Chociaż dla sprawiedliwości dodam, że istnieją co najmniej dwa rodzaje metryk technicznych, ta o której wspomniałem jest prostsza. Pomijając różne szczegóły techniczne, różnica polega na tym, że prostszą metrykę możemy użyć tylko wtedy, kiedy model daje nam finalny wynik.

Natomiast samo trenowanie modelu to jest iteracja i podczas tej iteracji jest też potrzebna metryka sukcesu, która na bieżąco koryguje nauczanie modelu (i zwykle wtedy chodzi o tę wewnętrzną metrykę techniczną). Możesz o tym pomyśleć tak. Jak uczeń chodzi do szkoły, to ma regularnie na bieżąco sprawdziany i np. raz na rok egzamin.

To właśnie taka jest relacja między tymi dwoma metrykami technicznymi – sprawdzającymi jak działa sam model.

Ważne jest to, że już wybrzmiało, że mamy “pośredników”. Na górze tej hierarchii jest metryka biznesowa, następnie metryka techniczna (zewnętrzna) i następnie metryka techniczna (wewnętrzna), która wprost wpływa na model. Pewnie już czujesz jakie są wyzwania, aby na trzecim poziomie robić to, na czym zależy na pierwszym. Jeśli zgubimy ten kontekst, co często lubią robić osoby techniczne, bo tak jest łatwiej, to szansa, że coś pójdzie nie tak, jest coraz większa.

W DataWorkshop mamy twardą zasadę, nigdy nie stawiamy metrykę sukcesu techniczną na piedestał, bo to nigdy nie było celem, tylko krokiem przejściowym. To jest ważne i ta reguła była wypracowana z czasem, pewnie docenisz je lepiej, kiedy popełnisz swoje błędy.

Dobry model a sukces projektu to dwie różne rzeczy

Być może kojarzysz takie podejście, kiedy mówi się w taki sposób:

1. Naszym celem jest osiągnąć coś dla przykładu wstawię tutaj literkę “A”

2. B pomaga nam przybliżyć się do A

3. Naszym celem jest osiągnąć B

No właśnie, to jest taki przeskok, na który często można trafić w praktyce i to myślenie jest pułapką.

Jak domyślasz się dla ML tym punktem B jest techniczna metryka sukcesu (lub metryka modelu), ale z punktu widzenia biznesowego to A jest celem. Inaczej mówiąc, celem końcowym nie jest osiągnąć model z dokładnością 80% według przyjętej metryki MLowej, bo w sumie z punktu widzenia biznesu nie wiadomo co to właściwie oznacza.

To stąd przychodzi inna ważna myśl do głowy. Jeśli, zespół ML/DS za dużo martwi się metryką techniczną i zapomina o metrykach biznesowych (lub w ogóle jej nie ma), to oznacza, że coś poszło źle.

Dodam, że niestety to jest częsty scenariusz i w pewnym sensie naturalny, grunt aby to zauważać i reagować. Tak jak już wspomniałem, sam często włączam się w różne role i dość regularnie łapię się na tym, że będąc w roli technicznej wpadam w stan skupienia całkowitego nad metryką techniczną, ale przełączając się w rolę lidera projektu i spojrzenie bardziej biznesowe trzeba zobaczyć kontekst metryki szerzej niż tylko ta techniczna.

Też jest pewna ważna myśl. To już wybrzmiało wcześniej, ale powtórzę – czasem metryka techniczna może wyglądać “tak sobie”, ale z punktu widzenia biznesu, to już daje wartość dodaną lub odwrotnie (niestety częsty przypadek), techniczna metryka wygląda dobrze, ale to nie daje wartości dodanej biznesu.

Tu pojawia się pytanie, po co tak dużo metryk: biznesowe, techniczne? Czy nie da się po prostu mieć jedną prostą metrykę sukcesu? No też chciałbym, aby to było tak proste, ale zwykle tak nie jest. Bo świat techniczny i świat biznesu dość mocno różnią się pomiędzy sobą. W świecie technicznym jest więcej matematyki i algorytmów, w świecie biznesowym – pieniędzy.

Dodam nawet więcej, z punktu widzenia technicznego świat biznesu nie jest logiczny, bo tam jest dużo nieracjonalnych rzeczy (np. dużo psychologii i innych spraw, które ciężko wyrazić matematycznie). Dlatego tak ważne jest jak najszybciej zbudować most pomiędzy tymi światami, bo inaczej szansa na sukces jest minimalna.

Podam Ci jeszcze mniej oczywisty przykład. Kiedy świat techniczny rozjeżdża się ze światem biznesu. Czasem jest tak, że metryka techniczna jest słaba, ale w tym jest wartość biznesowa, ale czasem bywa jeszcze ciekawej (przykład z życia). Metryka techniczna wyszła trochę gorsza, czy to oznacza, że jest źle? Bo wystarczy zrobić proste ćwiczenia i zapytać, co tak naprawdę teraz mierzymy i czy biznes patrzy podobnie?

Przejdźmy do przykładów, aby lepiej zrozumieć zagadnienie metryk sukcesu w ML w praktyce.

Opowiem Ci kilka przykładów z mojego doświadczenia i z DataWorkshop, gdzie pomagamy naszym partnerom wyciągać wartość z danych. Nie mogę wprost podawać danych i szczegółów, ale przykłady będą na tyle soczyste, że bez problemu pobudzą Twoją wyobraźnię i mam nadzieję pomogą Ci lepiej zbadać kontekst Twoich projektów.

Podzieliłem przykłady na branże, aby łatwiej było Ci identyfikować rodzaje wyzwań i problemów, ale nie musisz się ich pilnować. Czasem przykład z branży logistycznej jest bardzo bliski temu z e-commerce

Przykład 1 – logistyka i wypłacalność firm

Wyobraź sobie, że musisz odpowiedzieć na pytanie: czy warto zacząć współpracę z firmą x mimo iż spełnia podstawowe warunki – ma towar do przewiezienia i szuka zleceniodawcy, a Ty masz firmę logistyczną. Stoisz przed dylematem, podjąć się tego zlecenia czy nie. Skąd w ogóle takie pytanie?

Skąd ten dylemat? Dlaczego nie wykonuje się wszystkich zleceń? W sumie na to pytanie może być wiele odpowiedzi. W przypadku z mojego doświadczenia chodziło o wymiar finansowy. Co to oznacza?

Czy firma A faktycznie zapłaci firmie B?
Czy firma A jest zaufaną firmą? Chodzi o to, że jak znajduje się np. na tak zwanej czarnej liście dla urzędu skarbowego, to może nieść ryzyko niewypłacalności i przy okazji powodować inne problemy.

Nas (z punktu widzenia modelu ML) jednak najbardziej interesowało w kontekście tego projektu, czy firma zapłaci. Tylko znów pojawia się pytania, co to oznacza w praktyce “czy zapłaci”? Jak to możemy jednoznacznie zdefiniować? Popatrzmy na to z perspektywy osi czasu.

Porozważajmy…. Kiedy uznajemy, że dana firma jest wypłacalna, a współpraca udana?
Jakie mamy opcje?

zapłaci przed wykonaniem pracy (zaliczka 100%)
zrobi zaliczkę przed, ale nie zapłaci resztę po
zapłaci tuż po wykonaniu zlecenia (w ten sam dzień)
zapłaci tydzień po wykonaniu zlecenia
zapłaci miesiąc po wykonaniu zlecenia
zapłaci więcej niż miesiąc po wykonaniu zlecenia
zapłaci częściowa i różne kombinacje czasowe

Po zrozumieniu, że definicja wypłacalności, stało się zrozumiałe, że nie mamy jednoznacznej odpowiedzi na te pytania, a definicja “firmy, która płaci” wcale nie jest taka trywialna. Skoro nie mamy danych wprost “czy zapłaci” lub te dane nie są tak jednoznaczne, to też nie możemy wytrenować modelu i tego zmierzyć.

Naturalnie pojawia się pytanie, co dalej? W takiej sytuacji zwykle chcemy trochę zmniejszyć złożoność problemu, ale aby wynik też był wartościowy i przybliża nas do głównego celu. Pytanie było takie, jeśli prognozujemy czy firma zbankrutuje, czy to już nie rozwiąże częściowo nasz problem? Bo firma, która bankrutuje nie ma pieniędzy (i to dlatego bankrutuje), więc brzmi, że nie zapłaci. Co ważne dane o bankructwie firmy można znaleźć w zewnętrznych źródłach danych. To oznacza z kolei, że już możemy to policzyć.

Kolejna ważna rzecz z punktu widzenia metryki biznesowej. Każdy model będzie się mylić, więc od razu trzeba zrozumieć, że są koszty błędu dwóch rodzajów: sytuacja, kiedy przegapimy firmę “bankrutującą” i zadajemy sobie pytanie, na ile to nas boli lub w drugą stronę, kiedy “za dużo” firm wg modelu zbankrutuje, a w rzeczywistości na dany moment mają się dobrze.

Wtedy mamy taką sytuację, że firma B odmówi we współpracy z firmą A mimo iż może ona zapłacić. Od razu podpowiem, że najlepiej na to pytanie odpowiedzieć przeliczając to i kalkulując na różnych przykładach. Wtedy to znacznie bardziej przemawia biznesowo. Jakie są możliwe scenariusze: w sumie trzy najważniejsze:

Pierwszy błąd jest zdecydowanie gorszy, niż drugi.
Błędy bolą podobnie, więc nie możemy uznać, że któryś jest gorszy.
Drugi błąd jest zdecydowanie gorszy, niż pierwszy (odwrotna sytuacja do 1).

Oczywiście na tym nie skończyła się przygoda. Pojawiły się kolejne wyzwanie, które udało się wykryć robiąc prosty prototyp od, ale to już inna historia, na którą jeszcze będzie czas.

Jak widzisz, startujemy z pewną abstrakcją, która wydaje się konkretem, czyli “czy firma zapłaci”. Swoją drogą, to jest prawie standard, że nawet tam gdzie mamy niby konkret, potem i tak robimy jedną czy więcej iteracji, aby upewnić się, czy jest spójność i jednoznaczność.

Też pewnie już widzisz, że z góry zakładamy, że każdy model będzie się mylić, pytanie tylko jak bardzo nas to zaboli? Który błąd zaboli mniej? To znów kolejny argument, dlaczego tak ważne jest dobrać właściwą metrykę sukcesu. To jest jak kompas, a my podróżnikami we mgle.

Przykład 2 – optymalizacja procesu produkcji w przemyśle

Być może też pracujesz w dużym przedsiębiorstwie, które coś produkują. Jeśli tak to wiesz, że optymalizacja procesów i redukcja odpadów produkcyjnych, to zagadnienia, które mocno się takim firmom opłacają. A jeśli są dane, to i możliwa jest optymalizacja z pomocą ML w wielu wypadkach.

Tylko jak znaleźć ten proces, ten etap który, gdzie uczenie maszynowe może pomóc? Inaczej mówić trzeba znaleźć nisko wiszące owoce, od tego zwykle najbardziej opłaca się zaczynać ML.

Zaczyna się prosto i skomplikowane zarazem – od zadawania pytań.

To, co my robimy w takich sytuacjach, to organizujemy na początku szereg spotkań z kluczowymi osobami np. tymi, które najlepiej znają produkcję i wyzwania z jakimi się mierzy zarówno na poziomie wykonawczym, jak i biznesowym (często różne osoby). W ciągu 2-3 dni po takiej serii wywiadów możemy wychwycić już naprawdę fajne ciekawostki i niespójności, które mocno rzutują na kolejne kroki projektu.
A więc wartość rodzi się już na samym starcie.
Kolejny krok to wspólnie wybrać proces, którym chcemy się zająć, bo są tam nisko wiszące owoce, czyli stosunkowo niewielkie usprawnienia są w stanie przynieść spore pieniądze dla firmy.

W tym przykładzie z branży przemysłu to była redukcja odpadów czy też zmniejszenie ilości produkowania wadliwych części i produktów, zresztą to jest dosyć popularny przypadek, bo tam firmy tracą zwykle dużo pieniędzy i zwykle da się sporo poprawić.

Ok, mamy już swój wzrok skierowany nie na całą firmę, a wybrany problem i proces, brzmi lepiej, ale wciąż trzeba znaleźć odpowiedzi na wiele pytań i to właśnie w kontekście metryk sukcesu, czyli doprecyzować, co właściwie oznacza sukces w takim wypadku, a co będzie porażką.

Co to oznacza w praktyce zmniejszanie wadliwych części? W jakim okresie czasie?
np. jak na jedną część w rok będzie mniej, czy to już sukces?

Wskazówka: w tym i każdym innym przypadku tego typu fajnie móc znaleźć taką metrykę biznesową, aby dało się to wprost przeliczyć na pieniądze, np. wiadomo, ile kosztuje produkcja np. 1 części, czyli wiemy ile firma straci produkując ją wadliwą. Liczymy, ile sztuk produkujemy średnio wadliwych nic nie zmieniając i o ile odratowanych walczymy, aby wysiłek włożony w optymalizację się zwrócił. I tutaj można by skończyć, ale dalej w sumie mamy wiele niewiadomych.

Jakie dodatkowe pytania warto zadać?

Czy mamy wpływ na to, by zmniejszyć liczbę wadliwych części?

Tu już nie ma łatwych odpowiedzi, bo np. posiłkując się przykładem, który jest mi bliski, z którym pracowałem, część materiałów, z których dany produkt jest produkowany są dostarczane z zewnątrz i faktycznie nie zawsze mamy wpływ na to, aby to naprawić, jeśli akurat tam jest problem. Odnotujmy to jako kolejny fakt na ten moment naszej historii.
Czym tak naprawdę jest produkowany produkt?

Czy to jest “coś pojedynczego” czy składa się z mniejszych innych części. Często, a przynajmniej z mojego doświadczenia, a widziałem to na własne oczy, taki produkt składa się z kilku lub kilkunastu innych części tzw. półproduktów.

I tu dochodzimy do fajnego punktu…

Zobacz, cel biznesowy to zmniejszyć ilość wadliwych produktów w ostatecznym rozrachunki – to też trudniejszy przypadek, bo nie zawsze mamy wpływ na wszystkie czynniki, które to powodują.

Nawet, jak model wykryje, że coś jest nie tak, to co dalej? Gdzie tu jest wartość dodana dla biznesu?

Ale nawet w tym przypadku jest, tylko trzeba ją zauważyć i zdefiniować.

Przykład – aby powstała kompletna część, wędruje ona przez linię produkcyjną i przechodzi przez różne etapy, gdzie za każdym razem dokonuje się pewna zmiana, która przybliża nas do finalnego produktu. Takie przejście zajmuje czas, jak się domyślasz także tutaj czas = pieniądz.

Załóżmy, że jednym z powodów wady produktów może być wada materiału użytego do jego produkcji. O co teraz walczymy? O to, aby wykryć to najwcześniej jak się da – oszczędzić czas, inne materiały, energię na produkcję czegoś, co będzie wadliwe, tylko zwykle dowiadujemy się za późno, że coś poszło nie tak.

Zwykle w takich fabrykach walczymy o minuty lub nawet sekundy, które źle wykorzystane powodują dalsze opóźnienia. Marnujemy czas na produkcję wadliwej części i nie produkujemy w tym czasie też tej prawidłowej = podwójna starta można powiedzieć.

Najczęściej popełniane błędy

Brak metryki sukcesu biznesowej.
Metryka biznesowa jest zbyt abstrakcyjna, np. nie mierzy pieniędzy lub chociażby czas
Metryka techniczna jest oderwana od metryki biznesowej.
Zespół zbyt dużo skupia się na metrykach technicznych i mówią, zbyt złożonym językiem do biznesu, zamiast tego, aby lepiej zrozumieć jaki problem biznesów chcą rozwiązać.
Każda metryka techniczna, to jest pewne przybliżenia, nie można jej ufać na 100%, bo tracimy tam szczególiki (podobnie jak tracimy szczególiki patrząc na wartość średnią), warto robić dodatkowe testy i sprawdzać co w rzeczywistości uzyskaliśmy.
Brak zarządzania ryzykiem, czyli pominięcia tego, że każdy model myli się, ale ten błąd może kosztować różnie i warto to rozważyć z perspektywy biznesowej i zacząć tym zarządzać świadomie.
Paraliż przed startem, skoro metryka jest dość trudna, to nie wiem jak zacząć. To źle, zacznij od czegoś i zrób kilka iteracji do przodu i wtedy będzie łatwiej skorygować metrykę, bo lepiej poznasz wycinek rzeczywistości, w której się obracasz. Innymi słowami, małymi krokami do przodu, na początek stawiasz pierwszy krok i prawdopodobnie wybierzesz gorszą metrykę, przynajmniej już zaczniesz iść do przodu. Ważne aby tylko nie zapomnieć skorygować tę metrykę, jak już zgromadzisz większe rozumienie.

Podsumowanie

1. Wybranie właściwej metryki jest trudnym procesem! Mało tego, zwykle nie da się to zrobić dobrze za pierwszym razem, bo jest zbyt dużo niepewności dookoła i rzeczywistość i tak nas zaskoczy.

2. Tylko to wcale nie oznacza, że trzeba wpaść w tak zwany paraliż decyzyjny i przez lata teoretycznie wybierać tę metrykę. Wręcz przeciwnie. Trzeba wybrać na początek w miarę prostą, która brzmi sensownie i przeprowadzić jak najszybciej eksperyment od początku do końca, aby lepiej zrozumieć jakie są ograniczenia, jakie są wady wybranej metryki (i dlaczego) i co możemy zrobić, aby to usprawnić. Wybrać kolejną metrykę i iść do przodu.

3. Ważne jest to, aby na danej iteracji była jedna główna metryka, nie można skakać lub przybliżać, bo inaczej nie wiadomo co z czym porównywać. Też warto mieć kilka, tak zwanych spadochronów zapasowych, czyli metryki wspomagające wykrywać anomalii. Te pomocnicze metryki, są po to, aby mieć większą pewność, czy to co robimy nadal ma sens.

Zadanie dla Ciebie

Czas na ćwiczenia. Wymyśl gdzie model ML może być pomocny dla Ciebie? Zacznij rozważać jak to będziesz mierzyć? Czy da się tam zmierzyć jednoznacznie? Czy są w tej metryce zawarty pieniędzy? Czy masz wpływ na to co chcesz zoptymalizować?
Podziel się swoim przemyśleniem ze mną :).

Artykuł Metryki sukcesu w projektach Machine Learning pochodzi z serwisu Biznes Myśli.

Przyszłość Machine Learning – prognozy praktyków i ekspertów

Vladimir — Sun, 26 Dec 2021 13:23:00 +0000

Kończy się rok 2021, witam Cię w 115 odcinku podcastu, który będzie nietypowy.

Jeśli uważnie słuchasz mojego podcastu odcinek po odcinku, to wiesz, że są pytania, które powtarzają się regularnie, niezależnie od tego, czym zajmuje się gość podcastu.

Zawsze pytam o książkę do polecenia i w tym roku regularnie pojawiało się pytanie o przyszłość, czyli co zdaniem gości czeka nas w niedługim czasie w branży Data Science, Machine Learning.

Wiem, że ciężko przewidzieć przyszłość, o ile w ogóle jest to możliwe. Swoją drogą daj znać, czy słuchasz lub czytasz futurologów i jak myślisz, na ile możemy dobrze oszacować, w którym kierunku będą rozwijały się pewne trendy. Tutaj warto zwrócić uwagę na to, że mogą pojawić się niespodziewanie czarne łabędzie i zmienić bieg wydarzeń nieoczekiwanie. Warto o tym pamiętać i zawsze mieć dużo pokory co do różnorakich przewidywań. Zarówno jeśli chodzi o życie, jak i ML.

Kończymy kolejny rok, za chwilę zaczynamy 2022 i zwykle takie przejście skłania do refleksji. Z jednej strony pojawiają się podsumowania, a z drugiej pytania o to co będzie w kolejnym roku i następnych. Dlatego ostatni odcinek w tym roku będzie podsumowaniem i prognozą przyszłości w jednym. Oddam głos ponownie gościom podcastu Biznes Myśli, którzy pojawili się w 2021 roku. Wrócimy do niektórych wypowiedzi na temat przyszłości w branży ML.

1. Transformery w uczeniu maszynowym – możliwości i ograniczenia

Krzysztof Choromański:

Wydaje mi się, że jesteśmy w ogóle na początku drogi do stworzenia nowej technologii, z której czerpać będzie cała cywilizacja, ponieważ oczywiście takim końcowym efektem, na który wszyscy czekają to jest ta sztuczna inteligencja. Ale jak słyszę często właśnie w mediach, że się mówi, że już mamy tą sztuczną inteligencję to tylko się uśmiecham, ponieważ wiem, jak daleko jesteśmy od tego. Stworzenie maszyny, która uczyłaby się przynajmniej częściowo jak człowiek jest jeszcze cały czas poza naszym zasięgiem.

Więc to wydaje się tak naprawdę największym wyzwaniem i mam nadzieję, że w przeciągu najbliższych X lat – nie wiem czy 20, 50, 100 – uda się zrobić duży postęp. To co jest niesamowitą własnością, którą ludzie posiadają to jest generalizacja, czyli uczenie się na podstawie bardzo małej liczby przykładów i generalizowanie skomplikowanych sytuacji, często sytuacji, w których nie było się wcześniej – na podstawie tej nabytej wiedzy.

Oczywiście algorytmy, z których korzystamy teraz nie mają z tym paradygmatem nic wspólnego. Nawet te Transformersy, o których mówimy z dumą, ponieważ pozwalają rzeczywiście nam zrobić to, czego inne architektury nie były w stanie, korzystają z olbrzymiej ilości danych i wymagają czasu na nauczenie.

Generalnie wydaje mi się w środowisku naukowym jest zgoda, że potrzebujemy zupełnie nowych idei, żeby trenować te systemy, które miałyby tą sztuczną inteligencję osiągnąć. Że tak naprawdę ten paradygmat głębokich sieci neuronowych, które zarzucamy ogromnymi ilościami danych i trenujemy przez X czasu to jest jakieś lokalne maksimum. Rzeczywiście wiele fajnych rzeczy możemy z tym zrobić, ale nie rozwiązujemy wielu problemów. Nawet w robotyce jest mnóstwo problemów bardzo namacalnych, które mamy teraz, które nie jesteśmy w stanie rozwiązać za pomocą standardowych technik, z których korzystamy dzisiaj.

Co tym nowym paradygmatem miałoby być – nie wiem. Gdybym wiedział to pewnie bym już starał się opublikować i byśmy to jakoś stosowali. Ciężko jest tak przewidzieć też rozwój nauki. To jest super losowa rzecz, jak działa ludzki mózg, że jak wpadamy na odkrycia. Teoria odkryć naukowych – nie mamy dobrej teorii odkryć naukowych stety albo niestety. Natomiast wydaje się, że jest potrzebna zmiana myślenia na temat takich standardowych technik, które teraz uważamy za klasyczne z punktu widzenia maszynowego uczenia, ale nie są efektywne, jeśli chodzi o ilość danych, które muszą być przetworzone.

Więc to jest wyzwanie. To jest oczywiście też moje marzenie, żeby w jakiejś mierze kontrybuować do tej nowej rewolucji, która moim zdaniem musi się wydarzyć, żebyśmy przeszli od problemów, gdzie maszynowe uczenie jest wykorzystywane, ale jest wykorzystywane ostrożnie do sytuacji, gdzie możemy w pełni zaufać algorytmom maszynowego uczenia w podejmowaniu skomplikowanych decyzji, które byłyby podejmowane na podstawie właśnie ekstrapolacji, tej informacji, przypadków do sytuacji, w których algorytm nigdy wcześniej się nie znalazł. Nie wiemy jak to robić dobrze i to jest Święty Graal wszystkich, którzy zajmują się teraz maszynowym uczeniem.

2. Dobre praktyki i sztuka nazywania rzeczy w Machine Learning

Marcin Możejko:

To jest bardzo dobre pytanie. Wspominałem, że wydaje mi się, że najbliższe 5 czy 10 lat może się różnić od tych obecnych. To już wydaje mi się powoli widać, chociażby w tym roku pierwszy raz mieliśmy mniejszą ilość aplikacji niż w zeszłym roku czyli pojawiły się pierwsze objawy saturacji też trzeciego świata, najbardziej dynamicznego. Więc mam wrażenie i po cichu liczę też na to, że możliwe, że zmienią się priorytety tego researchu. Wydaje mi się, że takie kolejne kroki milowe będą związane z takimi rzeczami, które teraz są mniej eksploatowane.

Nie wiem czy przewiduję, na pewno bardzo chętnie bym widział z tej takiej perspektywy, np. stworzenie nawet nie kolejnych modeli rozwiązujących kolejne problemy, tylko np. modeli generatywnych (już teraz powstają tzw. work models czyli modele, w których przewidujemy zachowanie środowiska albo rzeczywistości).

Przewiduję, że jeśli faktycznie ten świat najbardziej bujnego rozwoju spowolni i przyjdzie świat refleksji to wydaje mi się, że takim jednym z bardziej kluczowych rzeczy będzie stworzenie takich modeli, które będą dosyć dobrze odwzorowywać pewne rzeczywistości. Przez pewne rzeczywistości myślę, że np. stworzenie modelu, który może nawet w jakimś ograniczonym stopniu, ale będzie mógł wnioskować w sposób zrozumiały dla człowieka i np. w oparciu o to generować obrazy albo teksty potencjalnie nowe.

Wydaje mi się, że na początku to pewnie będzie w ograniczonym stopniu, ponieważ system symboli, nazw często jest dla nas bardzo nieczytelny. Ale liczę na to, że w ciągu 5 lat się uda tak to zrobić, żeby stworzyć takie modele rzeczywistości w jakiś taki sposób, który będzie korzystał ze sztucznej inteligencji. To jest taki kamień milowy w ogólnym rozwoju.

Natomiast to na co bardzo liczę to to się aktualnie już toczy, ale wydaje mi się, że jest taki trochę problem z transferem do danych medycznych, też obrazowych. Np. wydaje mi się, że ten przełam tam następuje, jest coraz szybszy, ale nie jest na pewno aż tak widoczny i tak bujny jak w zdjęciowej wizji komputerowej. Więc liczę na to, że te modele dojadą do tego poziomu, szczególnie, że takie modelowanie obrazowe pójdzie znacznie do przodu.

Trzeci taki kamień milowy to wspominaliśmy o tych systemach. Podejrzewam, że rzeczy związane z ryzykiem, niepewnością, dopuszczeniem, że jednak sztuczna inteligencja może się mylić i zapytaniem jej, kiedy się faktycznie myli i stworzenie technologii, która daje na to faktycznie rozsądną odpowiedź będzie kolejnym kamieniem. To są takie moje 3 przewidywania.”

3.Wyceń swoje mieszkanie z pomocą Machine Learning

Filip Finfando:

Patrząc na tempo, ostatnie 5 czy 10 lat temu to możemy się spodziewać pewnie wszystkiego. Myślę, że zespoły takie Machine Learning, związane z danymi zostaną z nami w firmach. Nie jako takie trochę wydzielone z takiego typowego zespołu IT czy zajmującego się software developmentem. Mam takie wrażenie, że nie wszyscy specjaliści IT chcą lub potrafią się zajmować tymi rzeczami. Chociaż mają te umiejętności to jakoś tak nie czują tego. Nawet jeśli projekt taki MAILowy jest bardzo dobrze zdefiniowany to zawsze nie do końca wiadomo jaki ten rezultat będzie, trzeba trochę pogrzebać, zawsze coś wypadnie. Więc jest dużo niepewności i wymaga to raczej osobnych zespołów.

Myślę, że też podobnie jak kiedyś, był jeden informatyk w IT, który podłączył drukarkę i zainstalował Windowsa i zrobił stronę internetową. Tak myślę, że w Machine Learningu też jest ta postępująca specjalizacja. Już nie mamy tylko Data Scientist, tylko mamy Machine Learning Engineer, mamy osoby Deep Learning Engineer, NLP Engineer. Widać, że każdy ma swoją działkę i myślę, że raczej ta specjalizacja będzie postępować.

Na pewno, tak patrząc po swojej pracy to myślę, że będzie więcej narzędzi do pilnowania danych, do przetwarzania, sprawdzania jakości. Widać, że teraz dużo takich startupów powstaje, które mają wspierać takie ML owe procesy czy przygotowania danych czy też w ogóle samych modeli. To wszyscy powtarzają, że większość pracy jest przygotowaniem tych danych. Myślę, że to wciąż jest prawda i dużo wysiłków będzie w tym obszarze podejmowanych.

4. Machine Learning & Cyber Security

Mirosław Mamczur:

Jak sobie o tym myślę czy tak jak mi się wydaję, bo widzę, że świat się zmienia to ja bym powiedział, że w ciągu najbliższych 5 czy 10 lat to ML staje się dostępne dla przeciętnych ludzi, zwykłego przedsiębiorcy, mniejszych firm. Teraz przede wszystkim z ML korzystają większe firmy, korporacje, które stać na to.

Natomiast mi się wydaje, że to pójdzie w takim kierunku, że te wszystkie modele, które są tworzone, analizy, wykrywanie anomalii to pójdzie w takim kierunku, że dowolna osoba dostanie jakieś tam proste rzeczy do składania klocków, podepnie swoje dane, automatycznie będzie zbierać te informacje i dawać właśnie takie informacje, np. sprzedawcom, że np. warto byłoby koło mleka postawić jeszcze jajka, bo najczęściej to jest brane. Wydaje mi się, że to w takim kierunku przede wszystkim pójdzie. Nie tylko Data Scientist będą robić czy ludzie od danych, a mam nadzieję, że to pójdzie w takim kierunku, że będzie dostępne bardziej powszechnie dla osób.

A odnośnie cyber security to jak sobie o tym myślę to wydaje mi się, że mogę mieć troszeczkę więcej tutaj obaw i to pewnie z tego powodu, że z tego co kojarzę to w tym momencie jeszcze nie ma ani jednego potwierdzonego ataku jakiegoś oprogramowanie, narzędzia, które ma w sobie zaszytą sztuczną inteligencję.

Natomiast pewnie wraz z rozwojem AI, zastanawiam się czy np. w przyszłości te wszystkie deep fake’i, które będą bardziej dokładne, będzie można obraz podmienić samego siebie i głos, czy to pójdzie w tym kierunku, że jeszcze wzmocnią bardziej te ataki phishingowe i jeszcze łatwiej będzie nakłonić klientów do podania jakiś rzeczy i okradzenia ich. Ale to mam nadzieję, że nauczymy się z tym działać, że coś nam pomoże, może technologia. Mam nadzieję, że to pójdzie w dobrym kierunku mimo wszystko.

5. Product Manager w zespole AI

Aleksandra Możejko:

Moja prognoza jest taka, że na pewno większy nacisk będzie położony na ocenę ryzyka związanego ze sztuczną inteligencją i machine learningiem. Tutaj też te rzeczy, o których mówiłam tj. Fairness i wyjaśnialność modeli. Wydaje mi się, że właśnie takie metody, które pochylają się nad tym, żeby rozwiązania machine learningowe były łatwiej wyjaśnienie, na jakiej podstawie modele podejmują decyzje, żeby nie były stronnicze i żeby jakoś tam te ryzyka szacować i estymować.

Będą się coraz mocniej rozwijały i za 5 lat będziemy może na takim etapie, gdzie to wszystko będzie bardziej uregulowane prawnie. Teraz to jest dosyć nowe, jeżeli chodzi o regulacje prawne tych kwestii związanych z podejmowaniem decyzji przez algorytmy. Tutaj mamy np. kwestie z autonomicznymi samochodami, gdzie mamy już od dawna technologie do tego, ale z powodów (nie jestem pewna czy tak jest) związanych z kwestiami, jak takie samochody ubezpieczać, to jeszcze nie jest wdrażane na szeroką skalę.

Jak ja miałabym przewidywać, wydaje mi się, że w ciągu najbliższych 5 lat (może 10) będziemy mieli takie kwestie jak właśnie wyjaśnialność modeli i to, czy modele są fair, uregulowane prawnie. I będą też istniały frameworki – już trochę istnieją, ale wydaje mi się, że to się rozwinie jeszcze bardziej.

A taki drugi obszar, który widzę, to wydaje mi się, że coraz więcej będzie zastosowań sztucznej inteligencji w biznesie i w ogóle na świecie i coraz więcej automatyzacji. Coraz więcej firm będzie też dokonywało transformacji cyfrowej i wykorzystywało rozwiązania, które wspierają, zwiększają automatyzację.

Natomiast taki obszar, który wydaje mi się, że teraz się rozwija i gdzie ja przewiduję, że za 5, 10 lat mogą być dosyć przełomowe zmiany, to jest właśnie wykorzystanie sztucznej inteligencji w medycynie, np. przy generowaniu leków, obrazowaniu medycznym, wykrywaniu różnych chorób i to wydaje mi się, że mogłoby być bardzo z korzyścią dla przyszłego użytkownika, klienta, czyli po prostu każdego z nas.

Tutaj jestem optymistką, bo tak snuję taką bardzo optymistyczną wizję przyszłości, że właśnie wszystkie modele będą wyjaśniane, że to będzie uregulowane prawnie i jeszcze AI będzie nam pomagało szybciej wykrywać choroby. Oczywiście niekoniecznie musi tak być, bo jest też bardzo dużo ryzyk z tym związanych, ale to są takie dwa główne obszary, gdzie ja widzę potencjalnie największy rozwój w ciągu najbliższych 5, 10 lat.

Mam nadzieję, że taka kompilacja inspirujących i motywujących do działania odpowiedzi na pytanie, jaka przyszłość przez Machine Learning pobudzi także Twoją wyobraźnię do rozważań w tym czasie. Podziel się swoimi przemyśleniami. Chętnie posłucham, jakie są Twoje prognozy i futurologiczne rozważania lub marzenia na temat Data Science, Machine Learning czy też szeroko rozumianego rozwoju koncepcji AI.

Czy może zastanawiasz się nad tym, jak będzie rozwijała się Twoja branża lub zawód? Stawiasz takie pytania?

Na koniec dodam jeszcze, że podobnie, jak w zeszłym roku w styczniu 2022 robimy przerwę, wracamy w lutym z nową energią po urlopie i nowymi pomysłami na podcast Biznes Myśli w 2022 roku.

Jeśli masz jakieś potrzeby lub pomysły, w którym kierunku może rozwijać się podcast, aby przynosił jak największą wartość słuchającym, to napisz do mnie koniecznie

Artykuł Przyszłość Machine Learning – prognozy praktyków i ekspertów pochodzi z serwisu Biznes Myśli.

Dobre praktyki i sztuka nazywania rzeczy w Machine Learning

Vladimir — Sat, 24 Jul 2021 15:25:19 +0000

Witam w kolejnym podcaście Biznes Myśli. Dzisiaj goszczę Marcina Możejko. To jest bardzo ciekawy, pozytywny człowiek. Marcin ma bogate doświadczenie zawodowe – z jednej strony twarde, wiedza matematyczna, z drugiej strony programistyczne, a z trzeciej strony to wszystko jeszcze łączy Data Science jako inżynier i próbuje być na krawędzi tych światów, które wcale nie jest tak łatwo połączyć.

Marcin opowiada, dlaczego to robi i jak to sobie definiuje.

Ostatnio pracował w TCL – chińska firma, która ma oddział w Warszawie. Akurat odszedł stamtąd. Dlaczego odszedł i co robi teraz – o tym wszystkim będzie dzisiaj. Ta rozmowa mogłaby być jeszcze dłuższa i myślę, że warto byłoby ją jeszcze kontynuować, bo niektórych wątków jeszcze w ogóle nie poruszyliśmy z Marcinem, a bardzo by się chciało je poruszyć. Też bardzo jestem ciekawy Twojej opinii, więc zapraszam do wysłuchania i czekam na informację zwrotną.

Dzisiaj będzie gorąco, ale to nie tylko z powodu temperatur za oknem, zapowiada się bardzo ciekawa rozmowa.

Cześć Marcin. Przedstaw się kim jesteś, czym się zajmujesz i gdzie mieszkasz?

Cześć, nazywam się Marcin Możejko. Aktualnie jestem i mieszkam w Warszawie, a zajmuję się Machine Learningiem w bardzo szerokim podejściu, ponieważ mam to szczęście, że w chwili obecnej jestem bardziej w Akademii, ale przez wiele lat pracowałem zarówno w Akademii jak i biznesie, więc można powiedzieć, że byłem zarówno inżynierem jak i researcherem, ale też dosyć mocno zahaczyłem się o biznes. Bardzo dziękuję za zaproszenie i mam nadzieję, że będziemy mogli podzielić się swoimi doświadczeniami w tych tematach.

Właśnie porozmawiamy i o Akademii, o doświadczeniu, o propozycji, którą miałeś i jaka była decyzja. Ale powiedz tak na początek: co ostatnio ciekawego przeczytałeś i dlaczego warto to przeczytać?

Propozycja, którą bym tutaj polecił to są „Niewidzialne miasta” Italo Calvino. Jest to pozycja literacka bardzo ciekawa. Książka ma bardzo ciekawą formę. Składa się z 64 krótkich opowieści, które też mają określoną, matematyczną, strukturę. 64 jest związane z szachownicą, w związku z tym są różne sugestie czytania tej książki. Fabuła opowiada o tym, że Marko Polo wędruje do Chin, tam spotyka Cesarza Chińskiego i opowiada mu o miastach, które odwiedził. Każde z tych 64 opowiadań jest opowiadaniem o jednym mieście. Bardzo chciałbym gorąco polecić tę książkę, ponieważ ona wbrew pozorom jest bardzo matematyczna. Wydaje mi się, że opowiada o takiej bardzo ciekawej przestrzeni pomiędzy kreatywnością a strukturą. Kreatywność to jest ten wędrowiec, a struktura to jest spotkany cesarz i jest dyskusja pomiędzy tymi dwoma końcami spektrum. Ja byłem zachwycony, więc na pewno gorąco polecam również inżynierom, wydaje mi się, że każdy wyciągnie z niej coś bardzo ciekawego.

Doświadczenie Machine Learning & Data Science

Bardzo dziękuję za to polecenie. Teraz Marcin opowiedz troszkę więcej o swoim doświadczeniu Data Science, Machine Learning. Jakie projekty miałeś okazję wykonywać do tej pory, w jakich branżach pracowałeś? Wiem, że masz ogromne doświadczenie.

Miałem szczęście zaczynać swoją karierę w czasach, w których inżynierów w Warszawie było bardzo mało. W związku z tym, kiedy było się inżynierem to parało się bardzo dużą ilością projektów z różnych źródeł. Uważam to za olbrzymie szczęście. Zaczynałem w ogóle w PwC firmie konsultingowej, gdzie pracowaliśmy z danymi stricte finansowymi albo klienckimi. Tam pracowaliśmy nad churn’em w banku wówczas, ale też mieliśmy okazję robić anomaly detection na czujnikach.

Pracowaliśmy też dużo w wizji komputerowej dla dronów. Po PwC miałem krótką przerwę w Microsofcie, gdzie pracowaliśmy nad rozpoznawaniem języka naturalnego. Byłem w zespole tłumaczeń i budowałem model, który oceniał ryzyko takich tłumaczeń z pewnym komponentem tłumaczenia decyzji.

A później przez 2 lata pracowałem jako główny inżynier w konsultingu w Warszawie, firma nazywała się Sigmoidal. Tam też pracowaliśmy nad bardzo dużą ilością projektów, które wchodziły zarówno w wizję komputerową, jak i rozpoznawanie mowy. Przede wszystkim natomiast był to język naturalny, ale też zdarzały się projekty typowo researchowe, nawet z takich fundacyjnych zagadnień Machine Learningu.

Równolegle do tej pracy, w wolnych godzinach też pracowałem akademicko. Miałem absolutorium, ale pisałem magisterkę. Pracowaliśmy właśnie nad projektami związanymi z wykrywaniem raka jelita grubego na zdjęciach. Później też w ramach współpracy z Uniwersytetem pracowaliśmy nad modelami generatywnymi, w których generowaliśmy białka antybakteryjne. Mam jeszcze jedne doświadczenie, ale podejrzewam, że pogadamy o nim później, więc to zostawię na później

Ostatnia firma, w której pracowałeś – chińska firma TCL, która ma oddział w Warszawie. Co ciekawego tam robiłeś?

Wydaje mi się, że jak wspomniałem wcześniej, że miałem dużo szczęścia w pracy z różnymi projektami to ten projekt był chyba największym szczęściem, który mi się przytrafił. Często jest tak, że w biznesie projekty są bardziej researchowe lub bardziej biznesowe, ten projekt był zarówno płodny biznesowo, jak i płodny badawczo, więc było to olbrzymie szczęście.

A sam projekt dotyczył neural architecture search czyli inteligentnego przeszukiwania architektur. Jednym słowem, tworzyliśmy algorytmy albo sieci neuronowe, które modyfikowały lub tworzyły inne sieci neuronowe. Celem tego projektu było to, że TCL jest firmą, która produkuje bardzo szerokie portfolio urządzeń – od telewizorów przez smartfony, nawet klimatyzatory, kuchenki – wszystko właściwie tam jest.

Każde z tych urządzeń miało jakiś określony chip, każdy z tych chipów miał określony silnik wykonywania inferencji sieci neuronowych, więc naszym zadaniem było stworzenie silnika, który znając to urządzenie, jak i znając ten silnik stworzy taki bardzo szybki algorytm (szczególnie do wizji komputerowej), rozwiązujący zadanie. Jest to problem o tyle ważny, ponieważ kiedy myślimy szczególnie o wizji komputerowej to takim dominującym podejściem jest podejście transfer learningowe czyli, że mam jakiś określony zbiór bazowych architektur, te architektury jakoś tam ubogacamy tak, żeby rozwiązywały nasze zadanie.

Natomiast tych architektur wydaje mi się, jest wciąż stosunkowo mało. W związku z tym, my w pewnym sensie wypełnialiśmy luki pomiędzy tymi architekturami i dzięki temu byliśmy w stanie dotrzeć do większej ilości urządzeń i rozwiązywać większą ilość zadań, co było potwornie satysfakcjonujące.

Tutaj jeszcze tylko wspomnę dla słuchaczy – o AutoML mamy osobny odcinek 101. Tam co prawda było na temat takiego klasycznego uczenia maszynowego, a nie poszukiwania sieci.

Powiedz jeszcze trochę więcej na temat ciekawych wyzwań, które udało się znaleźć, bo te wyzwanie było całkiem nieintuicyjne. Wymień kilka wyzwań i z czego to wynika, jakie były rozwiązania.

Wydaje mi się, że w chwili obecnej mówimy tutaj o Transfer Learningu, ale taki Transfer Learning jest dwufazowy. W pewnym sensie pierwsza faza jest taka, że ten Transfer polega na tym, że bierzemy konkretną architekturę i ta architektura w pewnym sensie jest wykorzystywana w naszych zastosowaniach, ale jest drugi taki Transfer Learning (nazwijmy to Meta Transfer Learning), który polega na tym, że jest to transfer w pewnym sensie z researchu, badań, Akademii, do biznesu w tym sensie, że to Akademia w pewnym sensie wymyśla problem. Czyli kiedy np. Akademia chce zbudować jakąś konkretną sieć, która zdaniem badaczy jest szybka to wówczas automatycznie to, w związku z tym, że biznes przejmuje te algorytmy od nich to właśnie to jest transferowanie również tego przekonania co do tego, że ta architektura jest szybka.

W chwili obecnej wydaje mi się, że też z powodu tego, że badanie takie ogólne zajmują się ogólnie postawionymi problemami. Takim dominującym wyznacznikiem tego czy sieć jest szybka to jest liczba operacji wykonywanych w danej sieci. Możemy spojrzeć jak np. każda konwolucja jeśli chodzi o sieci konwolucyjne, wykonuje określoną liczbę operacji dodawania czy mnożeń czy operacji na liczbach zmiennych przecinkowych. To ta liczba właśnie jest takim uniwersalnym wyznacznikiem, czy sieć będzie wykonywana szybko czy wolno. Te sieci, które właśnie w Akademii według tego standardu są optymalizowane, żeby właśnie wykonywać szybko to właśnie te sieci przechodzą później do biznesu.

To okazuje się, że generuje wiele problemów bardzo nieintuicyjnych, ponieważ ta sieć dokładnie tyle operacji ile stara nam się uzyskać się uzyskuje, ale okazuje się, że operacja nie jest operacji równa. I tak wiadomo, że na końcu to będzie wykonywane na jakimś konkretnym urządzeniu, konkretnym silniku.

Powiem tutaj parę ciekawostek. Może zacznę od urządzenia. Np. okazuje się, że w chwili obecnej są bardzo określone przeploty np. w sieciach konwolucyjnych czyli np. kiedy używać większych, a kiedy mniejszych filtrów i to z powodu właśnie takich konkretnych optymalizacji niskopoziomowych. Różne przeploty po prostu dają różne wyniki, gdzie możemy mieć sieć, która wykonuje dokładnie taką samą liczbę operacji, ale z racji powiedzmy gdzie, jak głęboko w sieci, jakie operacje są wykonywane – te sieci będą miały zupełnie różne czasy wykonania.

Drugą warstwą, o której też wydaje mi się, że mało się mówi jest też warstwa konkretnego silnika. Np. jeśli chodzi o smartfony to możemy właśnie też na różnych urządzeniach wykonywać sieci przy pomocy różnych silników. Takie dwa podstawowe to bardzo popularny w chwili obecnej to TF Lite, który towarzyszy TensorFlow’owi. To jest właśnie taki silnik wykonujący obliczenia w sieciach neuronowych na wielu urządzeniach. Ale też jest np. taki silnik, który nazywa się SNPE i jest związany z chipami Snapdragona.

Okazuje się, że dokładnie dwie takie same sieci, wykonują się w zupełnie różnych czasach albo nawet nie to, że w zupełnie różnych, ale nie ma korelacji pomiędzy czasem wykonania. Wiadomo, że któryś silnik może być silniejszy, drugi wolniejszy. Okazuje się, że pojawia się tam potwornie dużo dziwnych czynników, które wpływają na wykonanie tej sieci. Taka chyba najbardziej ciekawa rzecz jest taka, że są pewne określone liczby filtrów, które każdy silnik preferuje np. TF Lite z naszych doświadczeń preferuje ilości filtrów w konwolucjach, które są podzielne przez 4 czyli np. intuicyjnie przejście z 4 filtrów do 3 filtrów może będzie się wykonywało tyle samo.

W związku z tym kontrintuicyjnie zmniejszenie sieci może wręcz czasem nawet wolniej, bo rzeczy, które się dzieją w silniku sprawiają, że jednak z tych 3 filtrów nagle jakoś robią się 4, w związku z tym dodatkowa operacja też zabiera czas. W związku z tym może dochodzić do takich kontrintuicyjnych sytuacji, że zmniejszenie sieci spowoduje jej zwolnienie.

Natomiast SNPE jest znacznie ciekawsze. Mianowicie SNPE preferuje ilość filtrów podzielną przez 32 i każda inna ilość filtrów jest źle wspierania. Czasami okazuje się, że zmniejszenie tej sieci albo nawet zwiększenie filtra dosłownie o 1 może totalnie wywrócić czas inferencji do góry nogami. W związku z tym jest tam bardzo duże pole do popisu, bardzo duże pole do optymalizacji. Wiele z tych rzeczy wydaje mi, że wręcz trzeba odkrywać. Jest to taka dodatkowa przestrzeń w optymalizacji modeli, która wydaje mi się być fascynująca, a podejrzewam nie do końca powszechnie znana.

Powiedz, czym się skończył ten projekt? Jak się z tym czujesz, kiedy Twój model albo model, którego w jakiś tam sposób dotknąłeś, kręci się na milionach urządzeń?

My właśnie rozwijaliśmy te algorytmy, które miały optymalizować te modele pod kątem różnych urządzeń. Co najmniej jeden model z tego co wiem. Niestety miesiąc temu odszedłem z TCL, więc na 100% wiem na pewno o jednym. Ale właśnie skończyło się to bardzo sprawnie działającym zespołem jak i również silnikiem do przeszukiwania tych architektur, który teraz nadal jest rozwijany i kilkanaście modeli już jest w kolejce do deploy. To uczucie jest potwornie satysfakcjonujące.

Też mieliśmy takie zadanie z poprawianiem zdjęć w galerii więc wydaje mi się, że to na pewno jest mega przyjemne, kiedy po prostu ktoś będzie mógł w wolnej chwili delikatnie poprawić swoje zdjęcie, korzystając z mojego algorytmu. Muszę przyznać, że robi mi się zawsze ciepło na sercu, kiedy o tym myślę. A tutaj mam przynajmniej milion powodów, żeby coś takiego się działo.

Nagrywając ten odcinek, używamy kamery. Właśnie widzę za Twoimi plecami dużo różnych książek. Są książki matematyczne, techniczne. Próbuje tak zrozumieć kim bardziej jesteś – czy chcesz się rozwijać w kierunku matematyka czy inżyniera? Bawiąc się architekturą, wybierając lepszą optymalizację to jest bardziej taka praca inżyniera. Jak się czujesz?

To pytanie, które ja sobie musiałem w końcu kiedyś zadać osobiście. Zauważyłem, że w różnych miejscach czułem, że nie do końca pasuję. Kiedy studiowałem matematykę, zaczynałem z takiej bardzo inżynieryjnej strony, natomiast na pewno samo piękno matematyki, wręcz estetyczne i syntetyczne mnie zachwyciło. Natomiast kiedy bardziej poszedłem w tę stronę, to też czułem, że czegoś mi brakuje – brakowało tej technicznej strony.

Zacząłem się nad tym głębiej zastanawiać i doszedłem do wniosku, że można te rzeczy właściwie ze sobą połączyć. Odnalazłem to połączenie. Dużą częścią pracy inżyniera jest umiejętność odpowiedniego nazywania rzeczy i wręcz wydaje mi się, że dobre nazwy, dobre zrozumienie rzeczy, nadanie im takiego sensu przez nazwę, pomaga rozwiązywać wiele problemów. Tak np. kiedy pracowaliśmy bardziej z biznesem, czyli z konkretnymi klientami, to np. nazywanie było potwornie istotne z perspektywy tego, żeby bardzo można było dokładnie określić problem, czyli zrozumieć, jakie są oczekiwania.

Umiejętność nazywania rzeczy jest kluczowa, żeby znaleźć wspólny język i żeby tak naprawdę wiedzieć, co jest ważne i co tak naprawdę musimy osiągnięcia.

Jeżeli spojrzymy sobie na to z innej strony, istotne jest także zbudowanie (pracując jako inżynier) też w takich biznesowych pipeline’ach to potwornie istotne było odpowiednie pokazywanie kroków, które tam się dzieją. Wówczas od tamtych nazw oczekiwaliśmy pewnie jakiejś separowalności, żeby też one brały pod uwagę urządzenia na jakich będą się wykonywały, ale też np. fajnie by było, żeby te różne nazwy wiązały się z czymś co potencjalnie później da się radę wykorzystać.

Zauważyłem, że właśnie jeśli się odpowiednio nazywa rzeczy, np. jeśli odpowiednio się powie, że ten komponent służy temu, że jeśli odbiorę ten tekst to ten tekst zwróci mi tę informację, to wówczas te nazwy nam pozwalają osiągnąć po pierwsze znacznie większą czytelność, a po drugie znacznie większą reużywalność.

Schodząc znowu poziom niżej, te poszczególne komponenty wiadomo, że trzeba zakodować korzystając z konkretnych frameworków, konkretnych języków itd. Podobnie jak mamy umiejętność nazywania w kodzie obiektów, interfejsów, to wiadomo, że to jest potwornie ważne, natomiast taką, wydaje mi się ważniejszą rzeczą, którą może trochę mniej się eksploruje, a którą odkryłem to jest to, że np. bardzo ważna jest separacja poszczególnych nazw od siebie. Mamy zazwyczaj do czynienia z co najmniej dwoma rodzajami nazw czyli takim nazwami naszymi czyli kiedy rozwiązujemy jakiś model oparty o tekst, pewnie mamy jakieś teksty, może czytelników. Pojawia się mnóstwo obiektów, które towarzyszą temu problemowi.

Natomiast wiadomo, że wszystko to trzeba w jakimś tam języku napisać, więc pewnie korzystamy Kerasa, Scikita, TensorFlow itd. Np. zauważyłem, że dobre nazwy są to takie odseparowane nazwy. Takie, które w pewnym sensie pozwalają odseparować te dwa światy, ponieważ kiedy te nazwy są nadmiernie związane ze sobą to zazwyczaj powoduje bardzo dużo problemów w dalszej części.

Jak to się wiąże z tymi książkami? Wydaje mi się, że dobre nazwy są pomieszaniem ponownie dwóch takich sprzecznych światów. Zazwyczaj im prostsze są jakieś i np. w jakimś sensie skracają zapis, tym są przyjemniejsze. Natomiast z drugiej strony wiadomo, że ta estetyka nie do końca wiąże się z użytecznością. Wiadomo, że na koniec dnia te nazwy mają być przede wszystkim użyteczne.

W związku z tym, kiedy ja odkryłem, że zarówno mam problem z tą taką bardziej inżynieryjną częścią i z taką bardziej estetyczną czyli, że nie lubię przebywać w takiej syntetycznej przestrzeni, w której te nazwy są czyste. W tym wypadku przez tę syntetyczną przestrzeń, takie akademickie podejście do programowania obiektowego, które wydaje mi się jest bardzo syntetyczne albo właśnie takie podejścia stricte akademickie do problemów to np. lubię, podobają mi się, ale z drugiej strony wydaje mi się, że często one są oderwane od takiej konkretnej praktyki.

Z kolei w tej praktyce to jest taka ciężka inżynieryjna praca, że ciężko jest podnieść głowę i spojrzeć na to, ponieważ jesteśmy skupieni na dowożeniu konkretnych zadań. Z tym też się nie do końca odnajdywałem, więc właśnie znalazłem sobie taką niszę pomiędzy. Właśnie mając szczęście, żeby pracując zarówno w biznesie jak i w akademii, jak i zarówno projektując jak i rozwiązując zadania, ogromnym szczęściem i radością dla mnie jest to, że udało mi się zaobserwować bardzo wiele złych nazw, dobrych nazw i właśnie w takim estetyczno-praktycznym procesie mogę tworzyć teraz swoje, co jest na pewno dla mnie wielkim szczęściem.

Słuchając Ciebie aż się chce wykorzystać tę umiejętność nazywania rzeczy. Wróćmy jeszcze na moment do chińskiej firmy TCL. Jak to się stało, że z jednej strony zrobiłeś bardzo fajny projekt, czuć tę satysfakcję i nawet jak nie widać twarzy to czuć w głosie, że jesteś bardzo dumny z tego, ale z drugiej strony odszedłeś. Spróbujmy to nazwać, co to się stało?

To jest bardzo ciekawe zjawisko. Odszedłem dlatego, że dostałem bardzo dobrą propozycję doktoratu i współpracy z grupą onkologii obliczeniowej na Wydziale MIM w Warszawie. Muszę przyznać, że z powodów osobisto-zawodowych, nie podjąłem doktoratu, chodziło również o rzeczy materialne.

Natomiast przez wiele lat to było moim marzeniem, żeby pójść na ten doktorat, więc teraz ta okazja się przytrafiła, z czego byłem szczęśliwy. Natomiast ten projekt był bardzo interesujący, zadowalający, więc to była na pewno bardzo trudna decyzja. Ale ostatecznie stwierdziłem, że w związku z tym, że są to tematy medyczne i okazja do zrobienia czegoś dobrego dla ludzi, którzy zmagają się z chorobami, to stwierdziłem, że jeśli dałoby radę wykorzystać tę radość (nazwijmy to radość nazywania, modelowania również w takim szczytnym celu) to wówczas wydaje mi się, że to przyniosłoby mi znacznie więcej spełnienia.

Natomiast jeśli chodzi o takie nazywanie to właśnie nazwałbym to taką ciężką decyzją, w której wydaje mi się, że takie długofalowe, zewnętrzne motywy wzięły górę.

Czuć, jak mocno rezonuje pomaganie. Myślę, że też to jest to bardzo sensowne, logiczne, aby ten potencjał, który technologia wytwarza wykorzystywać w odpowiednim kontekście. Tutaj wielkie brawa.

Świta AI w Chinach

Ale jeszcze domknę wątek odnośnie chińskiej firmy TCL. Świat Chin jest dość zamknięty i z jednej strony wiadomo, że tam dużo się dzieje. Pracowałeś w firmie, w której miałeś styczność z chińczykami, wyczułeś trochę tą różnicę jak oni myślą, jak oni działają. Powiedz o takich swoich przemyśleniach, czym się różni takie klasyczne podejście europejskie od chińskiego?

Może zacznę od takiej rzeczy, która może wydawać się anegdotyczna. Jednak większość firm w Polsce jeśli współpracuje z zagranicą taką dalszą, to są jednak te firmy w Stanach Zjednoczonych. Jest to o tyle ciekawe, że tam jest przesunięcie takie, że kiedy tam jest wcześnie, to tam jest późno. W związku z tym taki klasyczny tryb pracy programisty, który raczej mimo wszystko eksploruje późniejsze godziny jest naturalnie wykorzystywany. Natomiast w tym wypadku różnica jest w drugą stronę. W związku z tym główne godziny takiego przecięcia, które mieliśmy z naszymi współpracownikami z Chin były godziny ranne. W związku z tym no właśnie głównie management zajmował się kontaktem z Chinami.

Natomiast te godziny dostępności były też znacznie dłuższe, ponieważ pierwszą rzeczą, którą na pewno warto o Chinach wiedzieć to to, że te godziny pracy są tam znacznie dłuższe. Faktycznie pracuje się do znacznie późniejszych godzin, w związku z tym też automatycznie to przecięcie z godzinami w Polsce było znacznie większe. Często inżynierowie w Chinach pracowali do takich godzin późnowieczornych.

Co do takich moich obserwacji z ograniczonego kontaktu to taka rzecz, która wydaje mi się wywarła na mnie największe wrażenie, to jest kwestia skali. Nie mówię tego oczywiście w kontekście ilości produkowanych rzeczy albo skali rynku, ale też skali całego środowiska i tego, jak rozwija się technologia. Firma, w której pracowałem – TCL zajmuje się produkcją ekranów i w pewnym momencie wręcz padło stwierdzenie i zachęta ze wszystkich stron, że: „Słuchajcie, wszędzie, gdzie możemy położyć ekran to fajnie byłoby dołożyć do tego jakąś sztuczną inteligencję”.

W związku z tym były to zarówno telefony jak i telewizory, które w naturalny sposób mają ekrany, ale np. jeśli w klimatyzatorze albo jeśli w kuchence możemy wstawić ekran i chip to czemu tam też nie wstawić sztucznej inteligencji. W związku z tym to gdzie to ziarno potencjalnych pomysłów było rozrzucane to było naprawdę imponujące. W sensie skala tych produktów, które były dostępne i w których potencjalnie można było uzyskać wkład była naprawdę imponująca.

Druga rzecz, która zrobiła na mnie olbrzymie wrażenie to mnogość rozmaitych dostawców. Ten rynek jest zamknięty, ale z drugiej strony jest też bardzo duży. W ramach swojej pracy miałem do czynienia z olbrzymią ilością rozmaitych urządzeń, ale też rozmaitych chipów albo dostawców konkretnych fragmentów oprogramowania albo np. z chipami się wiązały różne silniki. Było to dla mnie zaskoczenie. W sensie mimo wszystko z perspektywy takiego europejskiego konsumenta, który ma dostęp do określonych produktów to zazwyczaj to spektrum jest dosyć szerokie, ale na pewno to było znacznie szersze. Więc to na pewno zwróciło moją uwagę.

Z tym wszystkim się wiąże taka rzecz, że tam się pojawia mnóstwo wątków, więc naprawdę liczba wątków czyli takich eksperymentów, prototypów pracy, która właśnie jest wykonywana w próbach nowych zastosowań, eksploracji nowych technologii jest naprawdę fascynująca – jest olbrzymia. Porównując swoje doświadczenie ze współpracy z rynkiem amerykańskim i europejskim to tam to podejście jest takie bardziej skupione. W sensie, że jest wrażenie, że tych projektów eksploruje się mniej, ale eksploruje się je dłużej. Właściwie to jest bardzo dobre pytanie w sensie jak te rzeczy się ze sobą porównują.

Ciężko mi tutaj podać jakąś konkretną odpowiedź, bo z jednej strony chińskie firmy produkują naprawdę olbrzymią ilość urządzeń, toczy się olbrzymia ilość eksperymentów, ilość doświadczeń zdobywanych przy tych rzeczach jest naprawdę niewiarygodna. Też wydaje mi się, że eksplorowane są znacznie często ciekawsze scenariusze, które często brzmią jak science-fiction i może na pierwszy rzut oka właśnie te prototypy nie wyglądają jakoś zachwycająco, ale no naprawdę każda kolejna iteracja jest lepsza.

Taka rzecz, która mi przychodzi do głowy to z tego co pamiętam Xiaomi ostatnio wypuściło prototyp ładowarki, która stoi w pokoju i ładuje telefon bezprzewodowo bez konieczności kontaktu z telefonem. Skojarzyło mi się to dlatego, że ten prototyp działa. Wydaje mi się, że jest to wczesna faza, więc pojawia się wiele problemów, ale mimo wszystko zostało to przedstawione jako ciekawostka i podejrzewam, że prototyp toczy się dalej.

Natomiast mam wrażenie, że właśnie to moje doświadczenie z firmami w Europie jest takie, że owszem tam też w pewnym sensie ilość tych eksperymentów się toczy, natomiast jak już jakieś konkretne eksperymenty wchodzą w grę to ilość uwagi, która jest jej poświęcona jest znacznie większa, bo w związku z olbrzymią ilością skalą eksperymentów i ich zakresem, wydaje mi się, że też znacznie łatwiej jest takie eksperymenty ucinać na rynku chińskim. W związku z tym, też ten czas poświęcony na to jest znacznie krótszy.

Wydaje mi się, że kolejne lata, na pewno obserwacja tego jak te różnice do takich produktów doprowadzą będzie potwornie interesująca. To były takie moje najbardziej poruszające obserwacje.

Każdy z nas, nawet jeżeli ma styczność z tym rynkiem, to jest zawsze taki wycinek, bo skala jest przeolbrzymia i w ogóle spróbować to jakoś usystematyzować co tam się dzieje i dokąd to prowadzi to pewnie nie jest takie łatwe, ale jest takie satysfakcjonujące. Jest taki żywy organizm, który w tej chwili mocno się rozpędza.

To jest taki być może już nastolatek, a już za chwilę będzie bardziej dorosły i czym to się skończy, jak to będzie dalej się rozwijać to pewnie rozmowa na znacznie dłuższą rozmowę, można się nad tym zastanawiać porządnie dokąd to wszystko dąży.

Dobre praktyki w Machine Learning

Zmienię teraz temat. Porozmawiajmy o dobrych praktykach, w szczególności w ML, biznesie, więc powiedz proszę, czym dla Ciebie są dobre praktyki w ML i może najlepiej właśnie w takich punktach, konkretach jakbyś mógł wymienić.

To jest bardzo dobre pytanie, też dlatego, że jest bardzo szerokie. Wydaje mi się, że jest ich wiele w ML, więc może podam jakieś konkretne przykłady w jaki sposób ten ML może się różnić i co uważam w tym jest dobrą praktyką. Wydaje mi się, że taką jedną linią podziału jest to, jaki jest oczekiwany czas ile to nasze rozwiązanie machine learningowe ma żyć.

Wówczas wydaje mi się, że taki prototyp albo taki krótki projekt, wiadomo, że wówczas te projekty są znacznie prostsze, ponieważ jest zdefiniowany dosyć prosty i konkretny cel do osiągnięcia, więc wówczas te projekty toczą się stosunkowo prosto i wydaje mi się, że też, kiedy uczymy się Machine Learningu lub kiedy wchodzimy w Machine Learning, to mamy styczność z takimi projektami, które mają krótki cykl życia. Natomiast wydaje mi się, że znacznie ciekawsze są takie projekty, które mają taki znacznie dłuższy cykl życia i tutaj wydaje mi się, że konieczność tych dobrych praktyk automatycznie jest większa.

W punktach pierwsza rzecz, która wydaje mi się bardzo dobrą praktyką to jest bardzo dokładne zdefiniowanie tego, co chcemy uzyskać. Czyli np. taką konkretną, bardzo dobrą praktyką jest po prostu nawet zrobienie takiego nazwijmy to mechanicznego Turka, którym my udajemy ten algorytm i po prostu ustalenie kontraktu i przeeksplorowanie bardzo konkretnych odpowiedzi na pytania na jakie klienci chcą uzyskać odpowiedzi, wydaje się to być oczywiste, natomiast naprawdę bardzo często może doprowadzać do ciekawych wniosków.

Bardzo często wychodzi mnóstwo różnic w terminologii, w oczekiwaniach. Takim chyba najbardziej klasycznym przykładem to było to, że w jednym momencie, podczas takiej jednej rozmowy klient, który był bardzo przekonany do tego co chce, właściwie totalnie przedefiniował zadanie. Miał to być jakiś problem klasyfikacji, okazało się, że to jest problem klasteringu tak naprawdę. Tych klas miało być 6, wyszło jest ich ponad 10 razy więcej. Okazało się, że skuteczność wcale nie jest taka istotna, żeby powiedzmy te klastry wydawały mu się najbardziej interesujące, wcale nie były takie ważne, a ważne było to, żeby te klastry, które są największe, a właśnie najmniej interesujące, żeby łatwiej odfiltrowywać.

Więc taką na pewno dobrą praktyką jest właśnie rozpisanie i poczucie tego co chcemy osiągnąć. Więc to jeśli chodzi o taką praktykę biznesową.

Taka praktyka niżej poziomowa, którą ja na pewno bardzo gorąco polecam to moje doświadczenie podpowiada mi, żeby bardzo mocno separować takie rzeczy, które są bardzo niskopoziomowo w języku programowania, w którym piszemy od takiej logiki biznesowej. Takie konkretne uwagi to jest tak, że np. bardzo często, kiedy chcemy np. napisać pipeline, w którym konkretne obiekty biznesowe są przekształcane w inne obiekty biznesowe, wydaje mi się, że bardzo trzeba tam unikać obiektów niskopoziomowych, bo to doprowadza do naprawdę olbrzymiego chaosu itd.

Zarówno z takiej perspektywy po prostu czystości tego rozwiązania, ale przede wszystkim modyfikacji czyli przyszłych rozszerzeń albo przyszłych dopasowań do tego. Czyli na pewno bardzo bym doradzał taką totalną separację od tych metryk.

Trzecia praktyka, która wydaje mi się też stosunkowo prosto, aczkolwiek bardzo często może unikać w rozwoju takich algorytmów machine learningowych to jest właśnie w jaki sposób walidować te modele.

Wydaje mi się, że to też trochę dotyczy tego punktu pierwszego, ale wydaje mi się, że przynajmniej taką praktyką, którą ja stosuję przynajmniej w części walidacji modeli biznesowych jest zastanowienie się jak będzie wyglądała pierwsza porcja danych, które ten model dostanie czyli, że w pewnym sensie definicja tego czyli np. czy to będą dane, które ten model będzie dostawał jednego dnia, czy to będą jakieś nowe dane, które po prostu przylecą z jakiegoś serwisu o danej godzinie itd.

Wydaje mi się, że takie wymyślenie sobie jak będzie wyglądał pierwszy dzień albo pierwszy taki atomowy, jednostka czasu użycia tego modelu, niewiarygodnie ułatwia zdefiniowanie tego w jaki sposób ten model należy walidować. Walidacja przebiega w ten sposób, że z części naszych danych po prostu wycinamy sobie taki fragment, który ewidentnie będzie zachowywał się w taki sam sposób i to ustawia nam zarówno strategię tej walidacji, jak i to co tak naprawdę będzie do tego algorytmu wchodzić.

Natomiast taką ostatnią cechą, też związaną z tym nazywaniem rzeczy to wydaje mi się, że właśnie w rozwijaniu takich długofalowych projektów to jest właśnie pamiętanie o takiej w sumie bardziej programistycznej zasadzie czyli pamiętanie o zasadzie otwarty-zamknięty czyli, że dobry kod powinien być otwarty na rozszerzenia, natomiast zamknięty na modyfikację.

Wydaje mi się, że szczególnie w wypadku Machine Learningów, w którym jednak często te modele to są obiekty nie do końca zrozumiałe co robią, często ciężko nam zrozumieć jak one działają. Potwornie jest ważne przygotowanie tego rozwiązania, żeby w pewnym sensie potencjalne zmiany albo rozszerzenia nie wpływały na to co się działo w naszym projekcie dotychczas. W związku z tym, że często jakby te modele wprowadzają bardzo dużo losowości do tego całego naszego pipeline to w momencie, w którym będziemy musieli kontrolować na ile to jest kwestia problemu czy modelu, a na ile to jest kwestia naszych zmian jest bardzo trudne.

W związku z tym, taką konkretną rzeczą, którą bym proponował, to właściwie sprowadza się do takich dobrych praktyk programistycznych jak odpowiednie ponazywanie rzeczy. Zasada otwarty-zamknięty najczęściej dzieje się wtedy, kiedy mamy jakąś czynność, która jest nienazwana i która jest w cyklu tego całego kodu, wykonuje się gdzieś. Wówczas, kiedy będziemy chcieli ją zmienić to jeśli mamy czysto napisany kod to jest wówczas podmiana pewnego interfejsu. Jeśli nazwiemy tę czynność i umieścimy odpowiedni interfejs, który ją wykonuje to wówczas podmiana tego polega na tym, że możemy po prostu wstawić tam nowy element i tworzy się nowa rzecz. W tym sensie jesteśmy otwarci na rozszerzenie. Natomiast jeśli ją zmienimy to moje najgorsze doświadczenie machine learningowe jest takie, że takie jakieś delikatne zmiany w jednym takim miejscu powodują niewiarygodne zmiany w innym.

Podsumowując wydaje mi się, że niewiele mówiłem w sumie o samych modelach, głównie mówiłem o programowaniu. Wydaje mi się, że taką na pewno dobrą praktykę jest też, żeby to wszystko łączyło się (mówię o długofalowych projektach).

Biznes & Akademia – czy mogą współpracować?

Wszystkie punkty, które wymieniłeś są fajne, rezonują bardzo mocno, warto się wsłuchiwać i też pewnie trzeba parę razy się oparzyć, żeby zrozumieć co miałeś na myśli. Powiedziałeś też, że właśnie będziesz robić doktorat w szczytnych celach. Porozmawiajmy też trochę o tym, ale tak trochę z innej strony. Jest sobie świat akademicki i biznes – one dość mocno się różnią od siebie, zupełnie inaczej podchodzą do projektów ML’owych i też jest zupełnie inna dynamika, inne cele wbrew pozorom.

Czy widzisz tu jakąś szansę na efektywną współpracę w polskich warunkach, pomiędzy światem akademickim, a biznesem? Co musi się stać, żeby taka współpraca w ogóle miała miejsce, a jeżeli już ma to co zrobić, aby była efektywna? Być może znasz jakieś konkretne przykłady, kiedy takie współpracy się zaczynają?

Oczywiście tutaj można wymienić NCBR, też zresztą bardzo duże środki w najbliższych latach będą wydane na takie projekty, ale z tego co słyszę to różnie to bywa i zdarza się, że w świecie akademickim pojawia się taki sposób, żeby spełnić pewne warunki formalne niż faktycznie pewne rzeczy wnoszą w taki sposób, że ten projekt raczej zabija się niż się rozwija. Temat jest trudny, być może nawet delikatny, ale chciałbym usłyszeć Twoją perspektywę. Co powinno się stać, aby właśnie te światy zaczęły współpracować, bo ostatecznie myślę, że na tym wszyscy mogą zyskać.

Ja bym trochę to pytanie podzielił i właściwie nawet zaczął od podzielenia jednego z głównych bohaterów tego pytania, czyli tego świata akademickiego. Mi się wydaje, że jeśli chodzi o Machine Learning i świat akademicki, przynajmniej moje doświadczenie podpowiada mi, że są co najmniej 3 takie światy, które wydaje mi się, że warto byłoby rozdzielić i każdemu przyjrzeć się bliżej.

Pierwszy świat – to jest taki świat, w którym traktujemy świat akademicki jako źródło wiedzy, którą student na etapie licencjackim lub magisterskim dostaje i potem w pewnym sensie możemy spytać się jak ta wiedza, którą on zdobywa w tym czasie, transferuje się na konkretny biznes, czy dany system edukacji generuje kandydatów, którzy później idą do biznesu i właśnie się w tym biznesie odnajdują. Wydaje mi się, że z tej perspektywy to odpowiedź jak to w chwili obecnej wygląda jest bardzo rozmyta.

Z jednej strony wydaje mi się, że (też myślę w kategoriach swojego wydziału MIM) z jednej strony każdy kolejny rocznik składa się naprawdę z świetnych programistów, którzy są szanowani na całym świecie. Są to też ludzie, którzy bardzo szybko adaptują się w biznesie, są bardzo cenione, więc z tej perspektywy wydaje mi się, że to jest na pewno super. Z drugiej zaś strony wydaje mi się, że to jest taka cecha przede wszystkim takiego kształcenia IT. Wydaje mi się, że w wypadku Data Science jest troszkę inaczej. Pierwszym problemem, który się tutaj pojawia jest to, że świat akademicki w ramach tego kształcenia akademickiego w naturalny sposób może robić bardzo ograniczoną liczbę projektów.

Widzę takie dwa największe ograniczenia. Pierwsze ograniczenie to jest po prostu czas. Jak rozmawialiśmy o dobrych praktykach i rozwiązaniach machine learningowych, które mają trwać dłużej to zazwyczaj myślimy o systemach, które mają działać wiele lat. Ze swego doświadczenia wiem, że są systemy, które tam żyją po 7, 10 lat itd. i wiadomo, że ciężko jest w ramach 6-miesięcznego kursu czy rocznej magisterki przygotować się do tego. W związku z tym wydaje mi się, że tego trochę nie przeskoczymy.

Natomiast z tego co wiem, tutaj jest bardzo fajna inicjatywa, która została podjęta – od przyszłego roku na MIM-ie rusza nowy kierunek związany ze sztuczną inteligencją i wydaje mi się, że tam bardzo interesującym rozwiązaniem, które się pojawia jest właśnie konieczność odbycia stażu. Z tego co pamiętam jest teraz na rok. Ja bym to nawet rozszerzył na 2 lata, bo wydaje mi się, że im dłużej ludzie współpracują i im dłużej mają styczność z rzeczą, która żyje znacznie dłużej niż te 3 miesiące albo pół roku, a potem się o niej zapomina, tym lepiej i to na pewno uczy zarówno dobrych praktyk i daje dobre intuicje tego co jest ważne, a co nie.

Drugi problem wydaje mi się być troszkę głębszy, ale jak się nad tym zastanowimy to jednak to co dla mnie osobiście jest strasznie fascynujące i przyjemnie w Machine Learningu jest to, że jednak te dane, ten problem wprowadza bardzo dużo losowości. Często rozwiązanie projektu machine learningowego to jest taka przygoda. Jest część nieprzyjemna, w której trzeba czyścić dane, ale na pewno taka umiejętność reakcji, radzenia sobie z niepewnością, zarówno co do danych jak i do samego problemu, jak i do algorytmu, wydaje mi się, że to wymaga takiej pewnej adaptatywności. Kiedy myślimy sobie o takim kursie akademickim to wydaje mi się, że po prostu na taką niepewność, taki trochę chaos na to przesadnie nie ma miejsca, ponieważ Uczelnia albo kurs to jest dokładnie miejsce, w którym w jakiś tam ustrukturyzowany sposób chcemy przekazać wiedzę.

W związku z tym wstrzyknięcie to w takiej umiejętności, żeby te kursy miały tą niepewność to jest to dosyć trudne. Też wydaje mi się, że jeżeli chodzi o matematykę, informatykę jest sprzeczne z aktualnym modelem nauczania, który raczej wiąże się z tym, że my mamy pewną taką naczelną wiedzę czyli wiedzę na temat danych działów matematyki albo danych technologii informatycznych, danych języków programowania itd. i po prostu chcemy tą wiedzę przekazać. Oczywiście to jest świetny początek do tego, natomiast z perspektywy dalszych kroków to może to robić takie wrażenie, że właśnie ta rzeczywistość jest taka dosyć uporządkowana, przewidywalna, że łatwo te problemy znaleźć.

Tutaj na pewno ciężko jest takiego rozwiązywania problemów w takim dużym chaosie się nauczyć. Liczę na to, że ten nowy program i konieczność odbycia stażu pomoże, natomiast wydaje mi się, że tutaj taka transformacja w kierunku takiego radzenia sobie z chaosem i radzenia sobie z takimi rzeczami, które żyją znacznie dłużej jest ważna. Więc to jest jeśli chodzi o taki punkt przygotowywania nowych pracowników i w jaki sposób to się tworzy.

Druga rzeczywistość akademicka, nazwałbym to taką rzeczywistością akademicką klasyczną. Czyli kiedy mówię o takiej rzeczywistości akademickiej klasycznej to myślę o takim profesorze, doktorancie, post docu, który pracuje nad swoją dziedziną, swoje wyniki publikuje w określonych czasopismach, te czasopisma mają proces review dosyć zaawansowany. Wymaga się właśnie w tej przestrzeni akademickiej wysokiej jakości tego rozumowania, wysokiej jakości eksperymentów.

Ten proces oczywiście często trwa długo i w związku z tym przenikanie tych nowych wieści i nowych nowinek trwa dłużej, co jest w sprzeczności z tym trzecim światem, bo to są dwa zupełnie inne światy. To jest też świat akademicki, który jest najbardziej związany z uczeniem maszynowym czyli te niewiarygodnie bujne środowisko badań w Machine Learningu.

Wydaje mi się, że są dwa zupełnie różne światy i wydaje mi się, że na pewno warto byłoby im się przyjrzeć, żeby zrozumieć w jaki sposób one wpływają i dyskutują z biznesem, bo to jest dosyć fascynujące. Ten drugi świat czyli w chwili obecnej ten najgorętszy świat, który bardziej niż w żurnalach żyje na Twitterze, w których artykuł, który ma tyle cytowań, że jest właściwie kluczowy dla danej dziedziny. To jest naprawdę fascynujący świat. Wydaje mi się, że obydwa światy zarówno w różny sposób dyskutują z biznesem, wpływają na niego i oczywiście w drugą stronę. Więc właśnie ja bym podszedł do tego bardziej holistycznie.

Wydaje mi się, że szczególnie jeśli chodzi o ten trzeci świat czyli ten świat najbardziej bujny to jest taka przestrzeń, która paradoksalnie wpływa w chwili obecnej na biznes znacznie bardziej niż ten drugi. Ja lubię sobie o tym myśleć, że ten aktualny świat, najbardziej bujny, lubię sobie często porównywać do Formuły 1 czyli, że to jest taki mega interesujący, wyżyłowany wyścig, w który są kamery z całego świata skierowane. Wszyscy wiedzą co tam się dzieje, znają kierowców, każdy chce z tego świata motoryzacyjnego coś uszczknąć itd. Wszyscy słyszymy, że co chwile jest jakieś nowe rozwiązanie w nowym bolidzie, nowy algorytm tam został stuningowany o te 3%.

Wszyscy są podekscytowani, wydaje mi się, że jest tam bardzo silna atmosfera i dzięki temu istnieje olbrzymia ilość hype na to, to też generuje olbrzymie zainteresowanie inwestorów, olbrzymie nadzieje i to jest ta pozytywna część tego świata.

Natomiast wydaje mi się, że istnieje też taka nie do końca pozytywna. Tutaj takie problemy, na które wydaje mi się, że bym chciał zwrócić uwagę to korzystając z tej metafory, że jednak biznes potrzebuje bardziej samochodu dla mas, dopasowanego do konkretnego transportu niż obserwowania tego najgorętszego show, w którym to jest. Więc pierwsza rzecz, która jest olbrzymim problemem w tym wszystkim to jest brak przenoszenia wyników z tego toru na taki zwykły ruch drogowy, co wydaje mi się być dosyć oczywiste. Tutaj widzę kilka problemów. Pierwszy problem często jest taki, że słyszymy i ludzie w biznesie słyszą, że sztuczna inteligencja rozwiązała problem X.

Ale właściwie co to oznacza? Czy to oznacza, że istnieje jakiś tor w tej Formule 1, na którym te pojazdy wykręciły faktycznie świetne wyniki, które potencjalnie nawet człowiek nie byłby w stanie wykręcić? Tutaj olbrzymi problem, który się pojawia jest to, że właśnie często ta definicja problemów w naturalny sposób w tym świecie najgorętszym, tam problemy nie istnieją w kategorii takich życiowych problemów tylko istnieją w kategorii konkretnych zbiorów danych i konkretnych wyników, na które trzeba to osiągnąć. To niestety się nie transferuje, ponieważ po pierwsze te problemy życiowe czy biznesowe generują zupełnie często inne dane, znacznie bardziej zaszumione, często w zupełnie innej naturze. To jest pierwsze źródło braku transferowalności.

Drugie źródło, które wydaje mi się być znacznie bardziej subtelne to jest to, że mam wrażenie, że wszyscy te tory znają. Strasznie mnie zafascynowało ostatnie badanie, bo kiedy np. pomyślimy sobie o takim zbiorze jak CIFAR-10 to w chwili obecnej wydaje mi się, że ilość treningów na tym CIFAR, szczególnie z bujnym rozwojem neural architecture search czyli ilość modeli, które były trenowane na tym CIFAR podejrzewam, że przekracza już ilość gwiazd w tej części galaktyki. Ostatnio ktoś spróbował zrobić taki prosty eksperyment, w którym po prostu spróbował stworzył nowe dane do tego CIFAR’a, które będą podobne do istniejących danych, ale będą mimo wszystko nowe.

Okazało się, że te wyniki w pewnym sensie drastycznie spadły czyli ewidentnie za każdym razem ścigamy się na tym torze i w ramach tych wyścigów rywalizacja jest uczciwa, natomiast jeśli ten tor delikatnie zmienimy to wówczas pojawiają się problemy i to też bardzo drastycznie wpływa na biznes, bo ten tor jest zupełnie inny i koniec końców doprowadza to bardzo często do zawiedzionych oczekiwań, co mi się wydaje być największym problemem dlatego, że właśnie ta transferowalność jest trudna.

Drugim problemem, który się tutaj tworzy to jest problem hype. Kiedy pracowałem w Sigmoidalu, braliśmy udział w konkursie. Zostaliśmy zaproszeni razem z innymi zespołami do tego, żeby brać udział w konkursie. Nagrodą w tym konkursie było podpisanie kontraktu, żeby rozwijać technologie dla tego klienta. Jeszcze dodam, że to był jeden z takich najbardziej ryzykownych działów dla tego klienta.

W związku z tym, kiedy pojechaliśmy na ten konkurs, który trwał dwa dni, skupiliśmy się bardzo bardzo mocno na tym, żeby te dane odpowiednio opracować, oczyścić je, znaleźć wszystkie potencjalne ryzyka, które się z tym wiążą. Bardzo mocno skupiliśmy się na tym ryzyku. Ostatecznie nie wygraliśmy tego konkursu, bo wygrał zespół, który te całe dwa dni na infrastrukturze klienckiej stawiał BERTa. Więc po dwóch dniach udało mi się w końcu postawić BERTa. Fakt, że ta nowa technologia była bardzo ważna.

Też wiem z takich rozmów z ludźmi, że szczególnie dla menedżerów też jest bardzo często ważne, żeby móc się pochwalić taką technologią. Mi się wydaje, że to generuje olbrzymi problem, ponieważ jednak te algorytmy na końcu są jakie są i też moje doświadczenie mówi, że często te wyniki nie transferują się na konkretne problemy, więc na pewno to powoduje rośnięcie bańki, niemożliwych do zaspokojenia oczekiwań. To powoduje bardzo dużo projektów, które po prostu próbuje się rozwiązywać przy pomocy tych bolidów. Po prostu nie wychodzi, co też automatycznie stanowi problem.

Trzeci problem z tym związany to które bolidy albo które rozwiązania są premiowane. Tutaj taki przykład, który mi przychodzi do głowy, który też jest bardzo pouczający – ja pracuję teraz dużo w modelach generatywnych czyli właśnie w rodzinie modeli, w których są GANy, autoenkodery, ostatnio pojawiła się technika dyfuzji. Przyjrzenie się temu jak wygląda rozwój tej dziedziny będzie bardzo pouczające. Kiedy powstaje jakiś nowy algorytm generatywny to okazuje się, że strasznie ciężko taki model generatywny jest zewaluować. To jest faktycznie prawda, ponieważ to co chcemy to w pewnym sensie chcielibyśmy uzyskać.

Model generatywny to jest taki model, który stara się w pewnym sensie zamodelować rozkład danych czyli jeśli mamy jakieś obrazki to chcielibyśmy model, który pozwoli nam wygenerować nowy obrazek bardzo podobny albo np. ocenić czy dany obrazek jest w miarę wiarygodny. Wbrew pozorom to jest bardzo trudne zadanie, ponieważ ciężko jest tak naprawdę zdefiniować co to znaczy jakiś rozsądny obrazek.

W związku z tym, taką dominującą metryką, która jest stosowana w ewaluacji tych modeli jest to czy obrazki, które są generowane przy pomocy tego modelu wyglądają ładnie czyli czy nie są rozmyte, czy mają odpowiednie tekstury itd. Jak się nad tym zastanowimy to częścią ewaluacji tych modeli jest to, żeby kiedy taki artykuł się pojawia, wygenerował obrazki, które będą miłe dla oka. Ja mogę powiedzieć ze swojego doświadczenia, że zajmuję się rozwijaniem jednej z takiej rodziny modeli i zauważyłem, że wiele innych zespołów, które właśnie korzysta z podobnych rzeczy i też czyta artykuły, które powstają w ten sposób, jedno z naszych doświadczeń jest to, że kiedy troszkę oderwaliśmy od tych obrazków i bardzo dokładnie się przyjrzeliśmy tak matematycznie tym modelom, też co one modelują, udało nam się np. uzyskać znacznie lepsze wyniki w wyborze tych modeli tylko dlatego, że troszkę odeszliśmy od tego, że to nie są obrazki i nie optymalizowaliśmy tych obrazków.

Więc mi się wydaje, że to może powodować konkretne problemy, natomiast samo w sobie pokazuje taki problem, że dosyć istotnym czynnikiem w tym środowisku jest to, żeby właśnie to środowisko odbierało algorytmy dobrze. Nie ma takiej konkretnej walidacji również biznesowej, bo ona po prostu jest bardzo trudna do uzyskania, natomiast też ta presja, żeby te algorytmy były interesujące, nowinkowe, na pewno dosyć mocno na to wpływa.

To środowisko z perspektywy biznesu wydaje mi się z jednej strony wpływa pozytywnie, ponieważ rodzi olbrzymie zainteresowanie, pojawiają się tam duże środki, natomiast właśnie te problemy, o których wspomniałem, dotyczą tego czego ja najbardziej się obawiam czyli takiego rozczarowania i pęknięcia tej bańki. Więc z tej perspektywy to dla mnie rodzi pewną obawę.

Tutaj oczywiście pojawia się ten drugi świat, o którym wspomniałem – klasyczny akademicki, zamkniętego review. W ostatnim czasie pojawiają się jakieś takie delikatne dyskusje pomiędzy tymi światami apropo właśnie tego co to znaczy dobry artykuł itd., więc ta dyskusja jest szalenie ciekawa.

Ja mogę ze swojej strony powiedzieć ciekawą anegdotę, że właśnie też kiedy też w ramach naszych współprac przygotowaliśmy artykuł do journala, w jednym miejscu zastanawialiśmy się dosyć długo czy dana operacja jest uzasadniona matematycznie. To wszystko obracało się w takim frameworku matematycznym, który nazywa się framework wariacyjny, ten framework ma określone założenia.

Tam zrobiliśmy rzecz, która była taka bardzo inżynieryjna, działała, ale ciężko było ją uzasadnić z tej perspektywy wariacyjnej. Zastanawialiśmy się czy to przejdzie przez review, a w tym samym czasie pojawił się artykuł, który zrobił jeszcze bardziej inżynieryjną rzecz, okazało się, że przeszedł przez review, tylko okazało się, że przyniósł naprawdę świetne rezultaty, więc to go obroniło.

Ale to też pokazało mi, że taki klasyczny świat akademicki jest bardzo skupiony na takiej jakości tych rozwiązań, żeby to było też takie spójne, czyste. Pojawia się takie bardzo dobre pytania.. z jednej strony wydaje mi się, że na pewno ta dyskusja pomiędzy tymi światami jest szalenie interesująca, przewiduję coraz większego rozczarowania, ten powrót potencjalnie starych, sprawdzonych metod będzie następował. Moja ocena tego jest taka, że to są dwie skrajności czegoś, co jest bardzo potrzebne.

Właśnie z jednej strony potrzebujemy tego parcia, tego pędu, z drugiej strony potrzebujemy też takiej kontroli, tego żeby te rzeczy były robione w sposób kontrolowany, żeby były też reprodukowalne. Więc po cichu liczę na to, że uda nam się w najbliższym czasie znaleźć bardzo ciekawą syntezę tych światów. Wydaje mi się, że to będzie potwornie ważne z perspektywy biznesu, również dlatego, że na pewno potencjalnie wprowadzenie jakiejś biznesowej walidacji do tego całego procesu będzie dla tego biznesu ważne.

Tak się przedstawia ten mój krajobraz tego środowiska.

Ciekawy był ten przykład z zakrętem, że wystarczy zmienić troszkę zakręt i już benchmark może się rozsypać albo pogorszyć. A w biznesie nie tyle, że zakręt się zmienia, tam rzeka nagle może się pojawić.

To jest też na tyle śmieszne, jak bierzemy sobie np. computer vision i fajnie jak mamy ImageNet, a jeżeli bierzemy sobie zdjęcie z komórki to tam ciemno, rozmazane i jakość nam zdecydowanie spada, a przede wszystkim takie zdjęcia są w dużej ilości robione. Ale jedna rzecz mnie ciekawi. Pierwszy świat na pewno Ciebie nie dotyczy, bo to już minąłeś, ale drugi i trzeci – to Ty dołączasz teraz do którego świata? Drugiego?

Wydaje mi się, że choćby nawet z oczekiwań doktorskich w chwili obecnej jest to raczej drugi świat, ale wydaje mi się, że z upływem czasu te granice zaczną się znacznie przenikać. Pamiętam jak na MIM’ie parę lat temu podejście do Machine Learningu było bardzo ostrożne, teraz to Machine Learning wchodzi w ramach nowego przedmiotu. Po cichu liczę na to, że wchodzimy w przestrzeń tej fuzji, że jednak się jakoś spotkają te światy. Aczkolwiek na pewno wchodzę z perspektywy tego drugiego świata.

Przyszłość Machine Learning

Dzięki za te wszystkie wypowiedzi. Zbliżamy się do końca. Na koniec pobawmy się trochę w futurologa lub marzyciela i spróbujmy dokonać takiej predykcji co może się wydarzyć za jakiś czas. Wiadomo, że różnie z tym bywa, nie zawsze to jest łatwe, ale wydaje mi się, że jak słuchałem Twoją wypowiedź to rozważać tak o przyszłości lubisz, więc myślę, że to pytanie też będzie takie fajnie trafne: jak myślisz jakie kamienie milowe przekroczymy za 5 czy 10 lat w uczeniu maszynowym i co wtedy będzie osiągalne?

To jest bardzo dobre pytanie. Wspominałem, że wydaje mi się, że najbliższe 5 czy 10 lat może się różnić od tych obecnych. To już wydaje mi się powoli widać, chociażby w tym roku pierwszy raz mieliśmy mniejszą ilość aplikacji niż w zeszłym roku czyli pojawiły się pierwsze objawy saturacji też trzeciego świata, najbardziej dynamicznego. Więc mam wrażenie i po cichu liczę też na to, że możliwe, że zmienią się priorytety tego researchu. Wydaje mi się, że takie kolejne kroki milowe będą związane z takimi rzeczami, które teraz są mniej eksplorowane.

Nie wiem czy przewiduję, na pewno bardzo chętnie bym widział z tej takiej perspektywy, np. stworzenie nawet nie kolejnych modeli rozwiązujących kolejne problemy, tylko np. modeli generatywnych (już teraz powstają tzw. work models czyli modele, w których przewidujemy zachowanie środowiska albo rzeczywistości).

Przewiduję, że jeśli faktycznie ten świat najbardziej bujnego rozwoju spowolni i przyjdzie świat refleksji to wydaje mi się, że takim jednym z bardziej kluczowych rzeczy będzie stworzenie takich modeli, które będą dosyć dobrze odwzorowywać pewne rzeczywistości. Przez pewne rzeczywistości myślę, że np. stworzenie modelu, który może nawet w jakimś ograniczonym stopniu, ale będzie mógł wnioskować w sposób zrozumiały dla człowieka i np. w oparciu o to generować obrazy albo teksty potencjalnie nowe.

Wydaje mi się, że na początku to pewnie będzie w ograniczonym stopniu, ponieważ system symboli, nazw często jest dla nas bardzo nieczytelny. Ale liczę na to, że w ciągu 5 lat się uda tak to zrobić, żeby stworzyć takie modele rzeczywistości w jakiś taki sposób, który będzie korzystał ze sztucznej inteligencji. To jest taki kamień milowy w ogólnym rozwoju.

Natomiast to na co bardzo liczę to to się aktualnie już toczy, ale wydaje mi się, że jest taki trochę problem z transferem do danych medycznych, też obrazowych. Np. wydaje mi się, że ten przełam tam następuje, jest coraz szybszy, ale nie jest na pewno aż tak widoczny i tak bujny jak w zdjęciowej wizji komputerowej. Więc liczę na to, że te modele dojadą do tego poziomu, szczególnie, że takie modelowanie obrazowe pójdzie znacznie do przodu.

Trzeci taki kamień milowy to wspominaliśmy o tych systemach. Podejrzewam, że rzeczy związane z ryzykiem, niepewnością, dopuszczeniem, że jednak sztuczna inteligencja może się mylić i zapytaniem jej, kiedy się faktycznie myli i stworzenie technologii, która daje na to faktycznie rozsądną odpowiedź będzie kolejnym kamieniem. To są takie moje 3 przewidywania.

Fajnie, akurat nagraliśmy, zapisaliśmy, zobaczymy za 5-10 lat, sprawdzimy, skomentujemy. Brzmi bardzo ciekawie, w szczególności ten temat związany z obrazkami medycyny to temat, który wiem, że Ciebie bardzo mocno interesuje, więc też tam częściowo się przyłożysz, żeby to też się stało w jakimś tam stopniu.

Marcin, dzięki wielkie za rozmowę. Wyszła troszkę dłuższa, ale bardzo ciekawa. Myślę, że wiele ciekawych wątków tu padło. Nie wszystko w sumie zdążyliśmy omówić, ale myślę, że to jest dobra okazja, aby jeszcze raz się spotkać i przedłużyć przy kolejnym nagraniu. Życzę Ci wszystkiego dobrego, z doktoratem i innymi rzeczami, które chcesz zrealizować. Do usłyszenia, do zobaczenia. Cześć.

Dzięki wielkie za zaproszenie i do zobaczenia, cześć.

Dziękuję za wysłuchanie tego odcinka, wspólnie spędzony czas. Mam nadzieję, że również dla Ciebie to było takie pozytywne doświadczenie. Ciekawy jestem, co myślisz właśnie o tym podejściu, rozważaniu o umiejętności nazywania rzeczy, o tych poradach, które wybrzmiały od Marcina. Czy to są takie rzeczy, które chcesz u siebie w jakiś tam sposób zastosować? Podziel się swoimi przemyśleniami. Zawsze chętnie posłucham Twojej opinii. To tyle na dzisiaj, dzięki wielkie, do usłyszenia.

Artykuł Dobre praktyki i sztuka nazywania rzeczy w Machine Learning pochodzi z serwisu Biznes Myśli.

Chmura Krajowa – sztuczna inteligencja i wykorzystanie danych w biznesie

Vladimir — Mon, 19 Apr 2021 10:17:14 +0000

Zaczynamy drugi sezon podcastu o sztucznej inteligencji i wykorzystaniu danych w biznesie!

2 sezon zaczął się trochę później, m.in. dlatego, że uruchomiliśmy w ramach DataWorkshop taką inicjatywę jak DWthon – hack outside the box, która pochłonęła więcej czasu. Zaraz Ci opowiem, o co chodzi, bo w tej inicjatywie też może być wartość dodana dla Ciebie.

DWthon to jest taka 5-dniowa inicjatywa, która pozwoliła osobom początkującym w ML lub nawet osobom, które wcześniej nie programowały, zobaczyć na własne oczy moc narzędzia o nazwie uczenie maszynowe. W praktyce to oznacza, że możesz przeżyć „na własnej skórze” co to oznacza osiągać 80% wartości przy 20% wysiłku, czyli robić mniej, a dostawać więcej. To nie jest żadne oszustwo, tylko tzw. smart working (inteligentna praca). Ponad 1500 osób wzięło udział w tej inicjatywie.

Taka krótka historia. Podczas urlopu przyszła świadomość, że warto wchodzić już na zupełnie inny poziom działania niż dotychczas, bo człowiek musi się rozwijać i pewne etapy już udało się osiągnąć.

Wytłumaczę, o co mi chodzi w tym zdaniu. W pierwszych naszych bezpłatnych inicjatywach próbowaliśmy pokazać jak skonfigurować środowisko lokalne i to jest wiedza przydatna, ale skończyło się na czymś innym. Bardziej zajmowaliśmy się tym, jak zainstalować biblioteczkę A czy B na laptopie niż ML. Generalnie rzecz biorąc to nie jest taka trywialna rzecz i tego można się nauczyć, ale to jest bardziej na temat tzw. DevOps niż ML.

Rozważaliśmy na ten temat i zaczęliśmy przechodzić w kierunku Google Colab. To jest takie środowisko, które udostępnia Google bezpłatnie. To środowisko ma wiele zalet, ale praktyka też pokazała, że nie gwarantuje, że środowisko będzie identyczne, tzn. przynajmniej w naszym przypadku. Jak uruchomiliśmy to przy większej liczbie uczestników (około 5000 testów mniej więcej było zrobione), to okazało się, że człowiek mógł zgubić się w którymś momencie, a Ty nie masz tam dostępu, nie możesz mu pomóc i to podejście też nie było najlepsze.

Rozważałem sobie, co możemy zrobić dalej i też porównywaliśmy jak to robimy w naszych płatnych kursach, które robimy w ramach DataWorkshop. Tam mamy gotowe środowisko z góry zainstalowane i cała konfiguracja nie jest taka trywialna. Ona potrzebuje dużo energii, żeby to zrobić, ale bardzo fajnie się sprawdza i tam przynajmniej pod kątem konfiguracji bibliotek w ogóle nie ma żadnych kłopotów, bo wszyscy mają w 100% identyczne środowisko.

Pomyśleliśmy sobie – a co jeżeli zrobić właśnie tak dla inicjatyw, które teraz robimy na większą skalę? Tylko tutaj pojawia się takie wyzwanie, bo co to oznacza? To oznacza, że np. tysiąc albo kilka tysięcy osób jednocześnie będzie zalogowanych. To już brzmi jako całkiem fajne wyzwanie, nad którym warto byłoby się pochylić, tym bardziej, że po urlopie jest troszkę więcej energii na bardziej szalone pomysły. W końcu weszliśmy w to, żeby to zrobić. Dużo eksperymentowaliśmy i udało się to zrobić. Wynikiem tego działania było to, że równolegle mogło się zalogować tyle osób ile było dostępnych (czyli ponad tysiąc). Każdy miał swój własny serwerek, na którym mógł takie rzeczy wykonywać.

Więc bardzo się cieszę, że udało się ten pułap przeskoczyć, wykonać kolejny krok. Myślę, że kolejną poprzeczkę trzeba teraz podnieść, np. 100 tys. lub 1 mln osób równolegle, które się zalogują. Nie wiem gdzie tyle osób znajdziemy, ale nad tym też pracujemy.

Zastosowanie chmury

Dlaczego w ogóle o tym wszystkim mówię? Tak się składa, że mimo tego, że słowo „chmura” raczej jest znanym słowem. Myślę, że dla Ciebie też jest znanym, bo skoro słuchasz Biznes Myśli, to raczej obiło Ci się to o uszy. Natomiast pytanie: czy ja to stosuję, to jednak jest duża różnica, prawda? Osobiście z chmurą jestem związany ponad 7 lat. Najpierw to był Amazon przez dobrych kilka lat, a potem przeszedł na Google Cloud i to mi bardzo się spodobało. Google Cloud akurat daje takie możliwości, kiedy więcej czasu masz na to, aby zająć się tzw. biznesem, a zdecydowanie mniej czasu potrzebujesz na różne konfiguracje. Jest takie poczucie, że kiedy to wszystko konfigurujesz to te klocki są fajnie zgrane ze sobą, że one się łączą. Podchodzisz do tego jak do klocków lego, np. wkładasz, dostajesz itd.

źródło: giphy.com

Kubernetes

Kolejna rzecz, ta inicjatywa o której wspomniałem – my tam pod spodem używamy tzw. Kubernetes. To z jednej strony open source, ale z drugiej strony, żeby go odpowiednio administrować (sam Kubernetes, nie mówię o konfiguracji na wyższym poziomie), to trzeba się postarać. Z jednej strony możesz zainstalować to nawet na serwer pod biurkiem, tylko wtedy potrzebujesz armii ludzi o odpowiednich kwalifikacjach (zwykle są w dużym deficycie) i koszty, które to generują. Więc to sprawia, że w tej chwili, jeżeli masz wybór, aby robić wszystko samodzielnie albo skorzystać z skonfigurowanych środowisk w chmurach to odpowiedź staje się oczywista.

Na temat chmury wprost nie było jeszcze ani jednego odcinka na Biznes Myśli, bo dla mnie jest to już taka oczywistość. Po prostu to działa, my to używamy i właściwie człowiek się zastanawia o czym tutaj można mówić. Natomiast jak robiłem sobie retrospekcję to uświadomiłem, że zwykle takie oczywiste rzeczy, czasem lepiej omówić dodatkowo, bo to może mieć znacznie większą wartość dodaną dla Ciebie niż tylko mówienie o tematach bardziej złożonych, czasem nawet bardziej abstrakcyjnych, które wykonuje np. DeepMind, bo też nie zawsze możesz to zastosować. Stąd taka decyzja, żeby w drugim sezonie przejść przez pewne tematy, które dotkną to co możesz wykorzystać wprost i dostać tego wartość dodaną.

Kolejna rzecz jest taka, że od 14 kwietnia w roku 2021 r. Google Cloud będzie również Data Center w Polsce. Dotychczas najbliższe to była Finlandia albo Niemcy. Teraz uruchamia się Data Center w Polsce i nie można było przegapić tego wydarzenia, bo to jest dość ważne dla firm, które prowadzą biznes z Polski. Dlatego też zaprosiłem człowieka z firmy, który jest mocno związany z tym co się dzieje teraz, żeby więcej się dowiedzieć. Ale również to jest człowiek, który zajmuje się nie tylko serwerami chmurą, ale bardziej wykorzystuje te serwery, aby rozpędzać AI albo ML.

O chmurze i wykorzystaniu danych w biznesie z Jakubem Kułakiem

Dzisiejszym gościem jest Jakub Kułak, AI Head w Chmurze Krajowej. Dzisiejszy odcinek będzie właśnie na temat chmury, o tym co to oznacza na dzień dzisiejszy. Jak może pomóc Ci w zbieraniu danych, w obróbce danych i też oczywiście użycie ML, AI w łatwiejszy sposób. Na końcu też będą bardzo fajne przykłady, które pokażą Ci, jak w łatwy sposób możesz zacząć używać już AI, ML już dzisiaj.

Cześć Kuba! Przedstaw się kim jesteś, czym się zajmujesz i gdzie mieszkasz.

Cześć Vladimir. Dzięki za zaproszenie do podcastu. Jestem Kuba. Z branżą IT jestem związany od prawie 20 lat. Kiedyś jako programista, architekt, teraz jako menedżer dbający o dobór odpowiednich technologii w projektach, o klientów i przede wszystkim specjalistów z moich zespołów. Aktualnie pracuję jako szef zespołu kompetencyjnego Data AI w Chmurze Krajowej, a co do mieszkania to po kilku latach w różnych miejscach na świecie, mieszkam aktualnie w Warszawie i póki co nie planuję żadnych zmian.

Czym jest chmura i jaką niesie wartość dla biznesu?

Dzisiaj będziemy mówić o chmurze i żeby lepiej to było zrozumiałe dla wszystkich, najpierw spróbujmy to zdefiniować: czym jest chmura?

Uważam, że nazwa „chmura” nie jest zbyt wdzięczna, ponieważ mimo, że rozwiązania chmurowe istnieją już prawie dwie dekady, to cały czas trzeba te definicje tłumaczyć i rozwijać. Natomiast spodziewając się takiego pytania po raz kolejny, postanowiłem tym razem poszukać trochę i zaskoczyć Ciebie oraz słuchaczy małym rysem historycznym – jednym spośród wielu, który chociaż trochę mnie przekonał.

Historia technologii cloud

Otóż dekady temu, jeszcze w XX w. (podejrzewam, że lata 80-te, 90-te) rysunki techniczne, diagramy (np. schematy sieciowe) wykorzystywały taki kształt dymku (nieregularny, przypominający chmurkę) do przedstawienia sieci zewnętrznej do której łączył się użytkownik, co było reprezentowane przez osobę przed monitorem – i taki piorun między użytkownikiem, a dymkiem. Z biegiem czasu ten dymek coraz bardziej przypominał chmurkę i w ten oto taki naturalny sposób, usługi zdalne spoza naszej sieci stały się usługami w chmurze.

Czym jest chmura?

Natomiast wracając do pytania i definicji, chmura to zestaw serwerów, infrastruktura, zestaw specjalnego oprogramowania i różnych usług dostępnych z serwerowni, zlokalizowanych gdzieś poza naszą własną siecią. Jeżeli jest to chmura publiczna tzn., że korzystać z niej może każdy kto jest zainteresowany i może za nią zapłacić. Na początku (mniej więcej 15 lat temu) usługi te ograniczały się najpierw do hostingu, ewentualnie udostępniania mocy obliczeniowej. Dzisiaj (zwłaszcza w przypadku chmur publicznych) to już setki różnych usług, dzięki którym można korzystać z najnowszych technologii (w tym sztucznej inteligencji) i superkomputerów do obróbki danych, bez konieczności martwienia się o serwery aplikacyjne, hardware, który to wszystko obsługuje, poprawki bezpieczeństwa, aktualizacje, backupy, powodzie itd. Na pewno o tych szczegółach jeszcze będziemy sobie dzisiaj rozmawiać.

Tak, dokładnie. Właśnie mówi się, że pojęcie technologiczne, firma, już nie dotyczy tylko sektora IT, ale przenika właściwie w różnych kierunkach. Taki przykład można na szybko znaleźć – np. w Rosji jest taka franczyza pizzeria Dodo i oni mają 250 pracowników IT – developerów, programistów.

Dość mocna jest w tym wypadku wykorzystywana chmura także. Część osób pyta: ale po co, przecież jesteście pizzerią? Po co Wam tyle programistów? Oni odpowiadają, że oni nie są pizzerią, tylko firmą technologiczną.

Teraz IT przenika w różne kierunku (przemysł, rolnictwo). Pytanie do Ciebie jest takie: czy Twoje doświadczenie potwierdza ten trend? Być może też masz pod ręką jakiś takie fajny, nieoczywisty, przykład jako dowód tego trendu?

Z pizzerią bardzo fajny przykład. Z mojej perspektywy biznes to biznes. Jest wiele cech, które łączą praktycznie wszystkie sektory, branże. Wszystko zawsze można zrobić z głową. Zresztą wydaje mi się, że do tego trochę nawiązuje trochę też nazwa Twojego podcastu Biznes Myśli. Wszędzie, gdzie wymagane są decyzje, najpierw trzeba zdefiniować problem, a dopiero później można próbować podejmować decyzje. Takie próby zawsze można wspierać za pomocą danych, które są odpowiednio zbierane, przetwarzane i prezentowane.

Wszędzie gdzie zadania są powtarzalne, bez względu na branżę, można je optymalizować za pomocą lepszej technologii czy algorytmów. Wszędzie, gdzie polegamy na ludzkich zmysłach, możemy zaprząc do pracy usługi tzw. kognitywne, które zastępują oczy kamerami, uszy mikrofonami i najczęściej wykazują się wielokrotnie większą precyzją niż my sami.

Nieoczywiste zastosowanie chmury i uczenia maszynowego

Gdybyś w pytaniu nie wspomniał o rolnictwie i przemyśle to pewnie szybko nie przyszłyby mi do głowy, bo Chmura Krajowa współpracuje z firmami z obydwu sektorów. Niejako naturalne jest już dla mnie to jak bardzo zaawansowane rozwiązania wykorzystuje się tam już od naprawdę wielu lat. Przykładowo, w kontekście rolnictwa, na podstawie analizy zdjęć satelitarnych, modele sztucznej inteligencji, machine learning są w stanie precyzyjnie określić miejsca i czas potencjalnego zalania przez wylewającą rzekę, topniejący lód czy kilka innych, mniej oczywistych powodów.

Algorytmy są w stanie rozpoznawać uprawy na polach (łącznie z ich chorobami) i tym samym przyspieszyć wprowadzenie środków zapobiegawczych, ratując zbiory i często zmniejszając straty rolników.

Kolejny przykład już nie z naszego rodzimego podwórka akurat (chociaż z drugiej strony nie wykluczam też) to samobieżne maszyny rolnicze, które prawie jak nowoczesne odkurzacze w naszych domach, same planują sobie trasę sadzenia, wycinki, kopania czy nawożenia pola). Produkcja – przede wszystkim kontrola jakości w produkcji. Tam się wykorzystuje algorytmy sztucznej inteligencji, np. do super szybkiego identyfikowania usterek i braków w produktach czy półproduktach. Dzięki różnym czujnikom chemicznym, akustycznym, naprężeniowym i wielu innych, w zależności od tego co się produkuje – i oczywiście kamerom, bo taka inspekcja wizyjna jest dużym działem tej sztucznej inteligencji w produkcji.

Bankowość i inne instytucje finansowe korzystają już teraz z bardzo zaawansowanych technologii do badania ryzyka kredytowego oraz wyszukiwania anomalii w logach z operacji wskazujących na potencjalne nadużycia przez swoich nieuczciwych klientów.

Widzimy, że każdą branżę da się usprawnić, przede wszystkim trafnie definiując problem i wdrażając później odpowiednie rozwiązania oparte o dane lub odpowiednio dopasowane algorytmy.

Cyfrowa transformacja biznesu

Porozmawiajmy teraz właśnie o takim procesie przejścia. Mówi się, że właśnie ten proces przechodzenia od świata rzeczywistego do cyfrowego jest nazywany digitalizacją (ang. digitalisation) albo cyfryzacją.

Tutaj taka krótka historia, która wydarzyła się niedawno. Miesiąc temu, w Krakowie palił się budynek Archiwum. Sporo dokumentów zostało zniszczonych i w sumie nie do końca jeszcze wiadomo, ile dokładnie. Niestety były to dość często dokumenty w jednej kopii. Owszem, czasem gdzieś można je odzyskać. Też niestety nie ma w większości przypadków ich cyfrowej wersji. To jest dość dziwny przypadek, bo wydaje się, że akurat jeżeli chodzi o archiwum to cyfryzacja powinna być rzeczą numer jeden, powinna być wręcz standardem.

Czy w innych branżach też to już staje się na tyle oczywiste, że przejście w kierunku cyfryzacji, to jest ogromna wartość dodana? Nie tylko jak w tym przykładzie z Archiwum, bo w tym przypadku wydaje się, że nawet nie ma o czym dyskutować, ale też dla innych branż, które niekoniecznie mają taką oczywistą wartość dodaną tej cyfryzacji. Co o tym myślisz?

Myślę, że dla nas – osób związanych z technologią już od dawna, takie Archiwum jest tak oczywiste i to nawet niekoniecznie przy wykorzystaniu nowoczesnych technologii, tylko zwykłego skanera i zapisania tego gdzieś na dysku, ale niestety w wielu przypadkach się to cały czas nie dzieje. Co do tej wartości dodanej i pytania to chyba padnie tu po raz pierwszy najbardziej popularna odpowiedź w IT czyli: „to zależy”.

Korzyści wynikające z cyfryzacji biznesu

Cyfryzacja biznesu może dawać wiele różnych korzyści, w zależności od branży, o której rozmawiamy. Różne zastosowanie nowoczesnych technologii w zależności od branży, specyfiki biznesu. Co innego znaczy cyfryzacja firmy produkcyjnej, a co innego placówki pocztowej czy sądu, ze względu na specyfikę.

Gdybym jednak miał wyciągnąć taki wspólny mianownik to pewnie byłaby to możliwość odciążenia ludzi z realizacji najbardziej monotonnych, nudnych, może bardzo ciężkich fizycznie zadań, poprzez ich automatyzację. Tak, żeby pracownicy mogli skupić się na innych, często ważniejszych zadaniach, do których np. wcześniej brakowało personelu lub wymagają specjalistycznej wiedzy, której zakodowanie w algorytmach jest póki co trudne lub nawet niemożliwe.

Dzięki cyfryzacji możemy korzystać z zaawansowanych narzędzi do analizy naszych dokumentów, danych, produktów, klientów, decyzji itd. Jak czegoś nie badamy, nie zbieramy danych to trudno wiarygodnie zmierzyć postęp. Część z nas to zna na pewno z testowania aplikacji, gdzie wprowadzając zmiany musimy wiedzieć jaki był stan przed, żeby wiedzieć potem jaki wpływ nasze poprawki miały na ogólną sytuację.

Natomiast cyfryzacja to bardzo szeroki termin, obejmujący wiele aspektów działania samej organizacji. Począwszy od uświadomienia sobie, jakie dane możemy zbierać i co nam mogą dać, aż po zmianę świadomości na taką, gdzie ludzie, pracownicy, zdają sobie sprawę czemu i jak powinny korzystać z tych danych. Swoje decyzje kierują lub w dużej mierze wspierają właśnie zbieraniem danych.

To wszystko aż do momentu powstania w firmie kultury, gdzie każdy myśli i kieruje się danymi czyli tzw. data-driven organization – najpierw osoby, potem zespoły, działy, aż do najbardziej zaawansowanej postaci, kiedy dostęp do danych (odpowiednio przygotowanych) mają już wszyscy i ma to pozytywny wpływ na działanie całej firmy. Natomiast temat tej dojrzałości był bardzo fajnie przedyskutowany w jednym z poprzednich odcinków Twojego podcastu, także to polecam.

Tak, dzięki. Również polecam wrócić do data-driven i jeszcze kilku innych odcinków na ten temat, bo o tym długo mówiliśmy.

Czym jest Chmura Krajowa?

Cyfryzacja, chmura i to całe podejście to jest raczej taka rzecz, która już nie staje się opcją, tylko jest w pewnym sensie koniecznością w większości przypadków, bo po prostu ciężko będzie konkurować i być bardziej efektywnym nie wykorzystując nowej technologii. To jak kiedyś 100 lat wcześniej nie było mechanizacji i rolnictwo było głównie pracą ręczna w 100% , w tej chwili to już jest normalne, że jest traktor, który wykonuje większość rzeczy. Jest jedynie kilka osób lub nawet jedna, która to obsługuje, a czasem nawet już ta jedna osoba nie będzie potrzebna. To rozpędza się bardzo szybko.

Już wspomniałeś, że pracujesz w Chmurze Krajowej i sama fraza Chmura Krajowa brzmi patriotycznie. Co to oznacza w praktyce? Powiedz kilka słów o tym, czym jest Chmura Krajowa?

To, że brzmi patriotycznie to oznacza tyle, że zostaliśmy założeni przez dwa podmioty krajowe i świadczymy usługi przede wszystkim na rynku polskim. Głównym celem naszych założycieli i pomysłodawców było stworzenie takiej platformy, która ułatwi i będzie stymulować rozwój polskich firm oraz administracji publicznej. Od początku istnienia trwały rozmowy i dyskusje Chmury Krajowej z największymi dostawcami chmur publicznych, żeby ich dostępność była jeszcze większa w naszym kraju, dzięki czemu wkrótce otwiera się region Google Cloud w Polsce.

Ważnym aspektem i celem od początku było też stworzenie organizacji, której usługi są w pełni zgodne i dostosowane do lokalnych regulacji, których w Polsce mamy bardzo dużo (zwłaszcza w sektorze finansowym), przez co nasze portfolio składa się z kompletu usług, dzięki którym klienci nie muszą zastanawiać się jak dostosować się do tych regulacji, a dostają odpowiednio dopasowany do nich produkt zgodny z tymi regulacjami, w tym nawet wsparcie w obsłudze prawnej. Zatrudniamy wiele osób, które mają doświadczenie biznesowe i techniczne zarówno na rynku prywatnym, jak i publicznym. Dzięki czemu znamy procedury i procesy na poszczególnych rynkach i możemy bardzo sprawnie wspierać te firmy i instytucje, zarówno z sektora prywatnego jak i publicznego.

Teraz po ponad dwóch latach istnienia widzimy, że jest coraz więcej klientów, którzy zastanawiają się bardziej kiedy i jak przechodzi się do chmury niż dopiero rozważających w ogóle taką drogę.

Czyli nie ma już pytań „czy”, tylko „kiedy” i “jak”.

Dokładnie tak.

Bezpieczeństwo danych w Chmurze Krajowej

Przygotowując się do tego odcinka, też badałem, co się dzieje w Internecie ale też tak przy okazji pytałem znajomych, przedsiębiorców, prezesów, czy wiedzą coś na temat Chmury Krajowej. Padło pytanie na temat dostępu do danych.

Biorąc pod uwagę, że założycielem, udziałowcami w tym przypadku jest PKO BP i Polski Fundusz Rozwoju, co to znaczy w praktyce? Czy to oznacza dla firma X wchodzącej w tę współpracę, zapisującej wszystkie dane w chmurze? Kto ma wgląd w moje dane?

Cieszę się, że się uśmiechamy obydwaj słysząc i wypowiadając te słowa. Jak już wspomniałem, Chmura Krajowa została stworzona z myślą o pełnej zgodności z regulacjami na naszym rynku. Już z tego w dużej mierze wynika, że dane firm, które przechowywane są na naszych serwerach są dostępne tylko i wyłącznie dla tych firm. Tutaj na poparcie tej tezy, nasze własne usługi, infrastruktura zostały zbudowane w oparciu o Cloud Control Matrix czyli frameworku budowania usług chmurowych od CSA czyli Cloud Security Alliance.

Nie będę wchodził tutaj w szczegóły, natomiast jest to framework, który wyróżnia wszystkie aspekty technologiczne, procesowe takich właśnie rozwiązań. Wszyscy najwięksi dostawcy usług chmurowych chwalą się posiadaniem takiego certyfikatu, który potwierdza zgodność (CSA Star).

Na bezpieczeństwo w Chmurze Krajowej (w tym danych) składa się także zespół Security Operation Center, który czuwa nad usługami 24 godziny na dobę, 7 dni w tygodniu. Oraz ponad 30 osób w samym zespole Security, które łącznie mają setki lat doświadczeń w pracy z wrażliwymi danymi i budowaniem bezpiecznych środowisk przechowywania i przetwarzania danych.

Google Cloud Data Center w Warszawie

14 kwietnia Google Cloud otwiera Data Center również w Polsce, w Warszawie. Fizycznie nie do końca wiadomo gdzie, ale gdzieś w Warszawie lub w okolicach. Nawet dobrze, że nie wiadomo, będzie bardziej bezpieczne.

Dlaczego to jest dobra wiadomość? Tak się składa, że my jako DataWorkshop też używamy Google Cloud już od dawna. Właśnie był taki dylemat, gdzie jest najbliżej Polski. Przez moment byliśmy bardziej w Belgii, teraz bardziej Finlandia i teraz jak będzie w Polsce to brzmi, że pewnie będziemy robić niedługo przeprowadzkę, albo przynajmniej część serwerów będzie stała tutaj. Ciekaw jestem, jak te wszystkie rzeczy się połączyły? Rozumiem, że Chmura Krajowa i współpraca, która się wytoczyła, przyspieszyła pewne procesy, prawda? I Google Cloud się tu pojawia, tak?

Tak jest. To bardzo bliska współpraca naszego zarządu, zarządu Google Cloud też miała tutaj duży, kluczowy wpływ na to, że ten region został stworzony i się otwiera rzeczywiście wkrótce. Będzie się nazywał europe-central2, to też już nie jest tajemnicą. Można to sobie zobaczyć w kalkulatorze cen Google Cloud, gdzie on już się od jakiegoś czasu pojawia. Do tej pory najbliżej były regiony Oslo, Frankfurt.

Na to, że jest to bardzo dobra wiadomość, składa się wiele aspektów. Po pierwsze, te najbardziej techniczne, najpierw liczymy przede wszystkim zagadnienie regionalizacji danych czyli możliwość takiego skonfigurowania wybranych usług, żeby nasze dane były przetwarzane i przechowywane tylko na terenie wybranego regionu. Dla wielu przedsiębiorstw jest to ważne zagadnienie, że dane nie opuszczają granic naszego kraju, chociaż w większości przypadków myślę, że wynika to bardziej z preferencji, może nawet sentymentu, ponieważ nie ma w Polsce przepisów, które wskazują, że dane muszą być przetwarzane na terenie kraju. Nawet RODO definiuje, że można przetwarzać dane osobowe poza granicami, ale oczywiście na terenie Europejskiego Obszaru Gospodarczego. To jeszcze nie ma oczywiście zastosowania do infrastruktury krytycznej kraju, ale to już zupełnie inna działka.

Kolejnym zagadnieniem technicznym jest czas połączeń, bo dla prawie 75% naszego kraju, każde pojedyncze połączenie z systemami Google Cloud, przyspieszy o około 15 ms. W przypadku jednej, hostowanej w chmurze strony, może nie ma to dużego znaczenia, ale w przypadku przetwarzania dużych wolumenów danych i systemów czasu rzeczywistego np. modeli machine learning, które bieżąco analizują setki tysięcy rekordów danych na sekundę i szybciej, taka zmiana jest już bardzo znacząca.

Są tam jeszcze aspekty rozwoju biznesu w Polsce, poprzez wzrost świadomości naszych przedsiębiorców, która na pewno spowoduje znaczny wzrost miejsc pracy w technologii i całym IT, ponieważ mamy w Polsce świetnych specjalistów, zarówno z kraju jak i zagranicy, choć już teraz jest ich za mało. Pojawiają się takie głosy, że Polska ma szansę stać się takim lokalnym cloud value, który będzie „ściągać” do siebie dodatkowo specjalistów od naszych sąsiadów z każdej strony. Ściągać w cudzysłowiu, bo teraz praca zdalna głównie (zwłaszcza w tej branży) – myślę, że pozostanie z nami już na bardzo długo.

Pozostałe powody to już te stricte, standardowe zalety po prostu przejścia do rozwiązań chmurowych.

Jakie usługi Google Cloud będą dostępne już w regionie Polska?

Wiemy, że w zależności od tego, jaki jest region to czasem nie wszystko jest dostępne. Jako przykład – w Finlandii nie ma TPU dostępnego i trzeba tutaj bardziej w kierunku zachodnim (jeżeli chodzi o Europę) szukać. Natomiast takie podstawowe zwykle są jak Kubernetes, CVM itd. Jak to będzie na starcie w regionie Polska i czy są takie jakieś usługi albo limity, o których warto już wiedzieć teraz?

Mogę powiedzieć, że będzie to taki pełnoprawny, regularny region Google Cloud. Nie różniący się znacznie w stosunku do tych, które są ostatnio uruchamiane. Najważniejsze usługi do uruchamiania aplikacji, przetwarzania analizy danych będą na pewno dostępne. Wspomniane TPU póki co nie będzie. Także jeżeli jest to niezbędne to trzeba będzie wybrać sobie narazie inny, konkretny region w którym te możliwości mamy. Natomiast nie jest to nic dziwnego, bo tak jak mówisz właśnie, tego typu jednostki pojawiają się tylko w wybranych regionach. A poza tym dostajemy w pełni wyposażony, standardowy region Google Cloud.

Jakie usługi Google Cloud usprawnią naszą pracę z danymi?

Fajnie, przejdźmy teraz do takich konkretnych use case’ów, bo tak rozmawialiśmy przed nagraniem, że czasem, jak człowiek siedzi w swoim “pudle technologicznym”, to nie zawsze zdaje sobie sprawę, że pewne rzeczy nie są aż tak oczywiste.

Ja na przykład na dzień dzisiejszy ciężko mogę sobie wyobrazić życie bez chmur. Można sobie wyobrazić, ale to będzie tak naprawdę robienie wszystkiego, aby utrzymać to rozwiązanie niż dawanie wartości ludziom. Chciałem to pytanie zadać w taki sposób, że w Google Cloud jest w tej chwili mnóstwo różnych usług, rozwiązań. Jeżeli ktoś tam wchodzi po raz pierwszy to prawdopodobnie nie wie od czego zacząć. Więc fajnie byłoby wykorzystać Twoje doświadczenie, które masz, a masz duże i zastosować taki filtr, na co warto byłoby zwrócić uwagę i o jakich usługach na pewno warto pomyśleć, jeżeli mówimy w kontekście danych. Czyli nie chodzi o sam machine learning jako tako, tylko dane.

W pierwszym zdaniu wymienię kilka usług i potem opowiem kilka zdań o każdej z nich. Najważniejsze to Cloud Data Storage czyli przechowywanie danych, Pop/Sub (system do zarządzania kolejką), BigQuery (flagowa hurtownia danych), Cloud Data Fusion (narzędzie do budowania pipeline).

To są te, które tak powinny zostać na początek w głowie, natomiast szacuję, że takich komponentów jest prawdopodobnie około 50, które są wykorzystywane do pracy z danymi i w zależności od tego, co z tymi danymi robimy, wykorzystujemy inne narzędzie.

Cloud Data Storage (tzw. CDS) to jest miejsce przechowywanie danych. To jest w chmurze, w której możemy tworzyć zbiory danych, plików o dowolnej zawartości, w których korzystamy również ze struktury folderów. Dane są oczywiście szyfrowane na kilku poziomach. W zależności od tego, jak często chcemy korzystać z tych danych, możemy dobrać odpowiedni model przechowywania, który pozwala nam na mniejsze koszty przechowywania plików, z których np. mniej korzystamy.

Konfiguracja pozwala nam zdecydować, w którym regionie nasze dane mają być składowane oraz to kto i w jaki sposób może mieć do nich dostęp. Przechowując dane w postaci plików csv lub innych popularnych formatów do przechowywania danych (tj. json) mamy w chmurze ogromne możliwości integracji z innymi narzędziami. To jest w ogóle przewaga rozwiązań chmurowych, że te komponenty, które są niesamowite same w sobie, mają też świetne możliwości integracji między sobą. Także podłączenie takiego Cloud Storage jako źródła danych do innego systemu, najczęściej ogranicza się po prostu do wyklikania tego i da się to zrobić dosłownie w kilka minut.

Pop/Sub, o którym to serwer kolejki komunikatów czyli w uproszczeniu – alternatywa np. do RabbitMQ. Rozwiązanie typu serwer less, co znaczy, że jest w pełni utrzymywane przez Google. Nie musimy się martwić ani o warstwę serwera aplikacyjnego ani sprzętowego. Ani o to, żeby ten serwer miał backupy czy wgrane najnowsze poprawki bezpieczeństwa. Po prostu tworzymy instancję takiej usługi i z niej korzystamy.

BigQuery, o którym mógłbym opowiadać naprawdę długo to flagowy komponent Google Cloud, właśnie do pracy z danymi. Myślisz dane w GSP, widzisz BigQuery – takie często widzę konotacje. W streszczeniu potęgę i najważniejsze cechy BigQuery – jest to skalowalna hurtownia danych. Pozwala na pracę z ogromnymi zbiorami (mowa tutaj o petabajtach i setkach petabajtów), korzystając z języka SQL.

Złożone zapytania sql-owe na tak dużych danych, wykonują się błyskawicznie. Rzędy wielkości szybciej niż w typowych rozwiązaniach, np. relacyjnych baz danych. Ogromną zaletą BigQuery jak i większości komponentów jest model w jakim rozliczamy się za korzystanie, czyli pay-per-use, w którym płacimy tylko za dane, które przechowujemy i czas kiedy je przetwarzamy. Co daje możliwości na naprawdę spore optymalizacje kosztowe wykorzystania naszej hurtowni danych.
Wiele rozwiązań do pracy z IoT to też bardzo popularny temat.

Jest to rozwiązanie, które się nazywa IoT Core, które pozwala na podłączanie, zarządzanie dziesiątkami tysięcy różnych rozwiązań. To są wszystko łatwe i fajne rozwiązania, natomiast to też nie jest tak, że nie znając Google Cloud w ogóle, otworzymy stronę i po 30 minutach będziemy mieli gotowe rozwiązanie. Tego też trzeba się oczywiście nauczyć, jednak czas poświęcony na zrozumienie tych komponentów, które mają przyjemny, graficzny interfejs, w porównaniu do czasu i lat doświadczenia, które musielibyśmy mieć stawiając odpowiednie serwery, zagłębiając się w protokoły komunikacji urządzeń IoT, musieli zadbać o skalowanie takich rozwiązań jest po prostu nieporównywalnie. I to jest właśnie ogromna moc tych rozwiązań chmurach.

Zgadzam się w 100% z tym, co powiedziałeś. W Data Workshop też używamy wszystkich tych komponentów, które były i właściwie dzięki temu bardzo szybko się skalujemy w różnych naszych, wewnętrznych produktach. Tu np. jeżeli chodzi też o BigQuery to tak naprawdę może mieć normalną bazę danych (np. MySQL), ale BigQuery jest bardzo mocno zoptymalizowana pod ten Big czyli terabajty albo nawet znacznie więcej.

To jest takie normalne, BigQuery jest bardzo fajnie zoptymalizowane i wyniki widzimy bardzo szybko. Też fajna jest ta możliwość podpinania BigQuery w różnych miejscach, chociażby robienie dashboardów. Sprawna, fajna rzecz, którą aż chce się użyć. Właśnie kontynuując tą myśl dalej, bo przed ML zwykle mówimy o tym, żeby dane odpowiednio przygotować i to jest taka rola data engineering i jest taki słynny skrót w tej branży ETL czyli Extract, Transform, Load. Co to jest? Dlaczego to jest ważne i właśnie na ile chmura ułatwia życie, kiedy chcemy wykonać takie procesy przygotowawcze danych?

Super, ponieważ czuję, że w poprzednim pytaniu tam jeszcze zabrakło miejsca na naprawdę wiele fajnych komponentów, z których można korzystać. ETL podejrzewam, że większość słuchaczy dobrze kojarzy skrót tak jak rozwinąłeś. Proces pobierania danych z jednego lub więcej źródeł danych, przygotowanie lub raczej dostosowanie tych danych do naszych potrzeb i załadowanie ich później do np. hurtowni danych w celu dalej analizy lub raportowania. Jest to część standardowej terminologii procesów, systemów i osób zajmujących się danymi.
Takie przygotowanie czy dostosowanie, składać może się z wielu kroków, różnych transformacji, od oczyszczenia danych z błędnych wpisów, poprawieniu ich, o bogaceniu, o inne dane, sprowadzeniu do wspólnego formatu, który jest później akceptowany przez naszą hurtownię i kolejne narzędzia, z których korzystamy.

Google Cloud dostarcza wiele komponentów do budowania takich pipeline’ów, które adresują kolejne kroki ETL-a. Tu chyba skupię się przede wszystkim na Cloud Data Fusion, które pozwala dokładnie na budowanie takich pipeline’ów, nawet za pomocą interfejsu graficznego Drag&Drop – także niekoniecznie pisania kodu.

Oczywiście są też zwolennicy budowania takich rozwiązań za pomocą kodu, co oczywiście ma też swoje zalety i dla takich zastosowań Google Cloud posiada też rozwiązanie tj. Dataflow, które pod spodem ma Apache Beam co dla doświadczonych inżynierów danych jest już wystarczającą informacją.

Cloud Data Fusion posiada setki, a na pewno dziesiątki gotowych integracji z popularnymi systemami zewnętrznymi, które pozwalają na szybką integrację i szybkie pobranie danych. Oprócz tego setki wbudowanych, najpopularniejszych danych – usuwanie duplikatów, usuwanie anomalii, dzięki czemu w bardzo krótkim czasie jesteśmy w stanie zbudowanie pipeline, który na bieżąco będzie przetwarzał gigabajty danych z różnych systemów.

Pod maską Cloud Data Fusion uruchamiane pipeline są na klastrach Dataproc (to jest inny komponent). Jest to serwerowa wersja Hadoopa w Chmurze. Data Fusion automatycznie zmienia przepływy zaprojektowane w interfejsie graficznym na tzw. job’y Dataproca, które są potem uruchamiane. Istnieje oczywiście możliwość skorzystania z MapReduce lub Apache Spark – to już takie szczegóły, nie wiem czy warto w tym momencie wchodzić w to.

Kolejnym narzędziem jest np. Dataprep. Bardzo wygodny interfejs graficzny do takiego „przygotowywania” danych, ponieważ to narzędzie pozwala też na eksplorację wizualną każdego rodzaju danych, czy to posiadających zdefiniowaną strukturę i relację czy też nie. Dane są albo mogą być przygotowane do dalszych etapów ETL lub po prostu eksplorowane przez analityków w poszukiwaniu zależności i innych ciekawostek.

Google Cloud w swoim portfolio posiada również w pełni darmowe narzędzie do budowania raportów i dashboardów. Mowa tutaj o Data Studio, o którym też wspomniałeś, które jest połączeniem możliwości arkusza kalkulacyjnego z programem do budowania prezentacji. Jeżeli ktoś porusza się w miarę biegle w takich dwóch narzędziach to bez problemu zbuduje ładne raporty i dashboardy korzystając z Data Studio, które swoją drogą też ma setki konektorów do zewnętrznych źródeł, m.in. oczywiście BigQuery, pliki z Google Cloud Storage, Google Analytics ale też naturalnie do MySQL, PostgreSQL, Kaggle, różnych API facebookowych, Twitter itd. Dla zaawansowanych zastosowań business intelligence, Google posiada od ponad roku w portfolio Looker’a.

Jest to rozwiązanie klasy enterprise business intelligence i o jego możliwościach można by zrobić całą serię odcinków.
Także podsumowując, Google posiada rozwiązania na każde zagadnienie. Na każdą część ETL’a, na każdą część systemu pracy z danymi. Od momentu pobrania przez przechowanie, archiwizację, przetwarzanie, eksplorację i analizę, aż po raportowanie i najczęściej dodatkowo wykorzystanie elementów machine learning w analizie i predykcjach.

Jak wykorzystując dostępne usługi Machine Learning, można osiągnąć dużo, robiąc niewiele?

No właśnie, machine learning teraz możemy o tym porozmawiać, już jako kolejny krok taki logiczny, bo wspomnieliśmy o tym, że bardzo łatwo można dane przechowywać, potem odczytywać, przetwarzać i potem już jak je przetworzymy to aż się prosi, aby zastosować ML albo tzw. AI. Tutaj też warto powiedzieć, że jak zarówno Google albo inni więksi gracze chmurowi np. Microsoft, robią duże zaangażowanie albo takie mocne postępy w kierunku tzw. after ML czyli kiedy robiąc małym wysiłkiem, można osiągnąć fajne rzeczy.

Co prawda też warto zrozumieć jak do tego podejść i żeby to było nie teoretyczne to fajnie jakbyś podał tak z 3 albo więcej przykładów, żeby to brzmiało tak bardziej praktycznie. Jak wykorzystując dostępne usługi ML’owe, można osiągnąć dużo, robiąc niewiele?

Zacznę od tego, że na Google Cloud składają się w tym momencie dziesiątki różnych rozwiązań związanych z ML czy sztuczną inteligencją. To jest właśnie moim zdaniem jedna z największych zalet korzystania z rozwiązań chmur publicznych. Dostajemy dostęp do gotowych, budowanych miesiącami i latami rozwiązań modeli uczenia maszynowego, uczonych w odpowiedni sposób przez osoby z bardzo dużym doświadczeniem, które są już wgrane na serwer produkcyjny, mają wystawione restowe API, mają skonfigurowane logowanie błędów.

Wyskalują się nam do takich rozmiarów, jakich tylko będziemy potrzebować w ciągu minut, a nawet sekund. Sam dobrze wiesz ile pracy jest potrzeba, żeby przygotować odpowiednie modele, zbudować system do ich testowanie, wdrażania kolejnych wersji, zaimplementować do tego API, logowanie, skalowanie itd. To jest wiele złożonych tematów, a w chmurze mamy możliwość podjęcia karty kredytowej, stworzenia projektu i w ciągu kilka minut możemy z takiego rozwiązania zacząć korzystać.

Te rozwiązania sztucznej inteligencji są w Google dostępne na trzech poziomach. Powiedzmy takiej samodzielności albo gotowości do użycia. Nawiązując do pytania, skupię się do tych takich gdzie wiedza dotycząca znajomości algorytmów, wiedza dotycząca ML, niekoniecznie jest wręcz wymagana. Także ten pierwszy poziom to są takie gotowe modele, które dostajemy już razem z API. Tu nie potrzebujemy praktycznie żadnej wiedzy na temat machine learning, żeby zacząć korzystać z takich rozwiązań.

Przykładem jest tutaj np. Cloud Vision API, które po wgraniu zdjęcia, taguje je nam odpowiednimi etykietami. Szacuję, że tych etykiet jest około 40-50 tysięcy różnych, tj. niebo, samochód, komputer, osoba, krawat, książka, ulica, pies itd. Każde zdjęcie może być otagowane wieloma etykietami i przy każdej takiej etykiecie dostajemy procentową pewność algorytmu co do tej etykiety, czyli wgrywamy zdjęcie samochodu, dostajemy informacje – samochód z pewnością 99,5%. Z Cloud Vision API możemy korzystać albo przez stronę www, albo przez API z dowolnej aplikacji, którą tworzymy, albo z linii poleceń, jeżeli np. potrzebujemy jednorazowo otagować sobie zdjęcia. Cloud Vision API rozpoznaje też znane miejsca na świecie, budynki i inne popularne lokalizacje.

Rozpoznaje logotypy marek, rozpoznaje ludzkie twarze tzn. opisując je około 30 parametrami i starając się zdefiniować jakie uczucia, miny widać na tych zdjęciach. Naprawdę niesamowite. Każdy może teraz od ręki pobawić się wpisując w wyszukiwarce Cloud Vision API Demo. Tam pojawia się strona, gdzie można przeciągnąć zdjęcie i zobaczymy jakie są wyniki. Odpowiedź można obejrzeć sobie też w JSON na potrzeby późniejszej budowania aplikacji. Wgrywając zdjęcie samochodu, dostaniemy pewnie około 50 etykiet, czasem nawet z marką. Z takimi szczegółowymi elementami jak wydech, lusterko, hak itd. Naprawdę bardzo polecam sprawdzić jak to działa.

Dla branży retail interesujące może być to, że korzystając z tego rozwiązania można wybierać produkty podobne do siebie wizualnie. Tego typu zastosowania widziałem.

Innymi przykładami takich rozwiązań gotowych do użycia od ręki, są rozwiązania speech-to-text i text-to-speach, bazujące na modelach googlowych. Rozwiązania pozwalają na syntezę tekstu, również w języku polskim oraz w drugą stronę, na transkrypcję audio co może mieć bardzo szerokie zastosowania np. w biurach obsługi klienta, gdzie mamy nagrania rozmów z naszymi klientami i chcemy potem zrobić transkrypcję, żeby np. badać albo szukać różnych fraz, zwrotów w tych transkrypcjach. Użytkownicy telefonów z androidem oraz użytkownicy Google Home korzystają z tych rozwiązań praktycznie codziennie.

Bardzo ważnym, często badanym przez naszych klientów rozwiązaniem jest Dialogflow. Jest to narzędzie do budowania chatbotów i voicebotów. Rozwiązań, które możemy podpiąć pod numer telefonu lub do okienka czatu na naszej stronie internetowej i naprawdę w bardzo prosty sposób zaprogramować scenariusz rozmowy takiego chatbota. Pod maską Dialogflow działa wiele googlowych rozwiązań machine learning, w tym rozpoznawania mowy, intencji użytkownika, odpowiednie dopasowanie odpowiedzi i jeszcze kilka.

Ciekawe jest tutaj to, że nie tworzymy drzewiastych struktur rozmowy tylko definiujemy intencje i konteksty. Podczas rozmowy istnieje możliwość przepinania się między intencjami i nawet powrotu do wcześniejszych wątków, o których była mowa, dzięki czemu taka rozmowa jest bardziej naturalna.

Konfiguracja takiego chatbota to dosłownie opisanie, wypisanie pytań, zwrotów, którymi może posługiwać się użytkownik oraz odpowiednia liczba parafraz. Na jedno pytanie jak stworzymy 5-10 parafraz to jest już naprawdę bardzo dużo, wystarczająco, żeby później Dialogflow poradził sobie z kolejnymi parafrazami, nawet jeżeli użytkownik zmienia kolejność wyrazów w zdaniu. W takich wypowiedziach użytkownika można zaznaczyć, że oczekujemy np. liczby lub daty, albo nazwy, albo jakiegoś innego ciągu znaków zdefiniowanej listy.

Oczywiście istnieje możliwość integracji Dialogflow z bazą danych tak, żeby Dialogflow mógł odpowiedzieć nam np. informacją o cenie naszego produkty czy czasach odjazdu autobusów, w zależności od tego po co budujemy takiego chatbota. Do zbudowania takiego inteligentnego chatbota, korzystając z Dialogflow, naprawdę niepotrzebna jest żadna wiedza dotycząca sztucznej inteligencji, a w godzinę, dwie można zrobić bardzo fajne demo, które robi wrażenie na większości klientów.

Oprócz tego typu rozwiązań, istnieją też już rozwiązania typu custom, to już konkretnie dla inżynierów ML, specjalistów, którzy mają dużo bardziej sprecyzowane wymagania i potrzeby. Tam znajdziemy m.in. te wirtualne maszyny z GPU czy TPU, o których mówiliśmy wcześniej.

Jak rozpocząć pracę w chmurze?

Właśnie tak słucham tego, co opowiadasz i przypominam, że celem tego odcinka było to, żeby powiedzieć, jakie możliwości mamy w tej chwili w zasięgu ręki i tak naprawdę niewiele trzeba byłoby zrobić, żeby zacząć tego używać. Z drugiej strony, jednak nie jest to jeszcze takie powszechne. Stąd pojawia się takie dość naturalne pytanie: jak myślisz, co hamuje polskie przedsiębiorstwa, żeby zacząć używać w pełni chmury? Czy to chodzi o brak wiedzy, śmiałości, kompetencji czy jeszcze coś? Czy da się to jakoś zmienić?

źródło: giphy.com

Na podstawie wielu ankiet, jeszcze większej liczby spotkań z klientami bezpośrednio, z naszą firmą, ale też na większych wydarzeniach, przejawiają się zawsze te same zagadnienia w kontekście blokerów, hamulców przejścia do chmury. Wszystkie oscylują wokół braku wiedzy, braku edukacji, doświadczenia. Także po pierwsze nieznajomość rozwiązań, bo firmy po prostu nie wiedzą co można znaleźć w chmurze, oprócz magazynu do przechowywania danych i przykładowo jednostek mocy obliczeniowej. Google Cloud od kilku lat, regularnie dokłada kolejne, coraz bardziej sprofilowane, konkretne usługi do swojego portfolio.

W tym momencie znajomość tych wszystkich usług, nawet dla osób pracujących bezpośrednio z chmurą jest sporym wyzwaniem. Także przedsiębiorstwa nie wiedząc co jest chmurze albo nie zdając sobie nawet sprawy co może być w chmurze, nie wyciągają rąk, często nie wykazują chęci, nie mają czasu na rozpoznawanie samodzielne takich rozwiązań. Nieznajomość przepisów, trochę strach przed nowym, często firmy zadają takie pytania dotyczące właśnie bezpieczeństwa, o którym rozmawialiśmy: czy to jest na pewno bezpieczne, dlaczego jest bezpieczne, jakie mechanizmy powodują i kto będzie miał dostęp do tych danych?

Ważnym zagadnieniem jest często strach przed kosztami, natomiast który znowu wynika z niewiedzy, nieznajomości modeli rozliczeniowych w chmurze. Ludzi nie wiedzą dokładnie jak sprawdzić jakie będą koszty utrzymania ich systemów tym bardziej, że po pierwsze nie wiedzą jak te systemy będą mogły wyglądać w chmurze. Nie zawsze przeniesienie tej infrastruktury, którą mamy u siebie 1:1 do chmury jest dobrym rozwiązaniem. Także często warto skorzystać z konkretnych komponentów, tylko trzeba o nich dobrze wiedzieć.

Kolejny powód, znów dotyczący bezpośrednio edukacji to brak kompetencji technicznych pracowników firm. Nawet jeżeli w firmie istnieją chęci migracji lub przynajmniej rozpoznania technologii chmurowych na szczeblach menedżerskich to często jest niwelowane, blokowane lub negowane przez osoby, do których takie pytania trafiają, które przy natłoku prac codziennych nie są w stanie poświęcić wystarczająco czasu na rozpoznanie, poczytanie i taką obiektywną opinię na temat takich rozwiązań.

Blokerem często (już nie bezpośrednio związanym z edukacją i wiedzą) są koszty poniesione na aktualną infrastrukturę. Słyszymy od CEO czy CTO: „Ale ja wydałam rok temu X zł na to rozwiązane i nie dostanę teraz więcej pieniędzy na kolejne migracje i zmiany”.

To takie główne powody, które przychodzą mi do głowy i rzeczywiście pojawiają się regularnie w rozmowach z naszymi klientami. Zresztą wiesz, w wielu kwestiach i tutaj rozwiązaniem jest po prostu edukacja, edukacja, edukacja. A to, że Google otwiera region w Polsce spowoduje, że wszystkie powyższe tematy zostaną dobrze zaadresowane.

Rozwój technologii chmury w Polsce

Właśnie, to może doprecyzujmy. Jak Google Cloud, tak i Microsoft inwestuje duże środki, aby wybudować Data Center w Polsce. Tak jak wspomnieliśmy, Google właśnie otwiera się w kwietniu. Pewnie następny będzie Microsoft. Co to oznacza dla Polski? Czy te rzeczy się dzieją? Na co to może dokładnie wpłynąć i jakie my możemy zaobserwować zmiany po tych działaniach?

Duże środki, o których mówisz to oczywiście nie są tylko pieniądze na budowanie fizycznej infrastruktury, ale również na działania marketingowe oraz na szkolenia i zachęcanie przedsiębiorstw do korzystania z chmury. W dużej mierze właśnie na adresowanie tych hamulców, o których mówiłem przed chwilą. Działania te mają na celu znaczne podniesienie świadomości i wiedzy na temat rozwiązań i przede wszystkim samego bezpieczeństwo chmur publicznych. Zarówno dla osób technicznych, jak i tych bardziej odpowiedzialnych za decyzje biznesowe.

Część tych środków będzie przeznaczona na kredyty, które pozwolą na nieodpłatne albo mocno sponsorowane korzystanie z usług chmurowych, np. na czas budowy Proof of Concept albo przy zobowiązaniu się klienta na przeniesienie części workload’ów do chmury na jakieś inne benefity. To na pewno zwiększy liczbę chętnych do skorzystania, spróbowania i zapoznania się z możliwościami rozwiązań chmurowych.

Szkolenia z rozwiązań chmurowych, które będą i są już w sumie realizowane, również przez Chmurę Krajową, dla odbiorców na różnym poziomie zaangażowania technologicznego, czyli tych osób, które będą bezpośrednio pracować z chmurą i tych, które będą znały jej potencjał, żeby odpowiednio dopasować produkt czy strategię. Na pewno wpłyną bardzo pozytywnie na wiedzę i rozpoznawalność tych usług chmurowych wśród firm.

Regiony i akcje marketingowe Google i Microsoft będą miały również znaczący wpływ na wzrost liczby interesujących miejsc pracy w polskich firmach – ale na pewno też w samym Google i Microsoft. Więcej ludzi pracujących w chmurach i z chmurami to na pewno więce ciekawych pomysłów i dalej kolejne biznesy oparte o nowoczesne, fajne technologie i rozwiązania chmurowe.

Także podsumowując, widzimy dużo plusów na wielu różnych płaszczyznach i już nie możemy się doczekać.

Czyli brzmi to w tej chwili tak, że część osób wie, że chmura jest, ale z drugiej strony brakuje takich argumentów przekonujących, że w miarę łatwym sposobem można osiągnąć więcej. To oznacza, że to myślenie trochę musi się zmienić i nie chodzi tylko o wirtualną instancję, tylko masz tam szereg usług, które bardzo pięknie ze sobą się integrują. Tutaj mogę potwierdzić, że Google Cloud pod tym względem jest bardzo fajnie przemyślane, dlatego też używamy od dobrych kilku lat w DataWorkshop, bo pięknie to się integruje. Tam czuć, że ktoś dba o to i pięknie zszywa te wszystkie usługi, które są dostępne.

Zdecydowanie, ja nie mogę się nie zgodzić. Sam jestem użytkownikiem i polecam wszystkim. Natomiast trzeba na początku zdefiniować cały problem, który chcemy rozwiązać i potem znaleźć odpowiednie rozwiązanie między naprawdę wieloma fajnymi komponentami Google Cloud.

Nasz odcinek dobiega końca. Dzięki wielkie, że udało się znaleźć chwilę czasu, aby porozmawiać i podzielić się swoim doświadczeniem, które jest duże. Jak wymieniłeś te wszystkie komponenty, które też dają możliwości to aż sprawia wrażenie, że się chce po odcinku usiąść i je zobaczyć, chociażby odpalić Cloud Vision Demo. Bo to naprawdę w tej chwili kwestia minut czy pół godziny, aby zobaczyć pierwsze wyniki. Więc dzięki wielkie, że udało się porozmawiać i do usłyszenia przy następnej okazji.

Super, dziękuję bardzo, było mi bardzo miło. Pozdrawiam.

Artykuł Chmura Krajowa – sztuczna inteligencja i wykorzystanie danych w biznesie pochodzi z serwisu Biznes Myśli.