Sztuczna inteligencja, cyberbezpieczeństwo i hackerzy

Z tego odcinka dowiesz się:

czym jest cyberbezpieczeństwo
jakie wyzwania czekają ludzi, gdy roboty przejmą naszą pracę
jaki związek ma uczenie maszynowe z cyberprzestępczością
dlaczego powstała cyberprzestępczość i dlaczego jest niebezpieczna
czy uczenie maszynowe może pomóc w walce z cyberprzestępczością
jakie są efekty ataków hakerskich
jak wyglądają statystyki odnośnie cyberincydentów
na czym polega atak DDoS
jaka jest różnica pomiędzy atakiem hakerskim a cyberincydentem
czym zajmuje się firma Grey Wizard
jak dbać o bezpieczeństwo swoich danych w sieci
czy cyberataki mają tendencję wzrostową
czy programy zabezpieczające przed cyberprzestępczością wpływają na szybkość strony
jak ocenia kurs „Praktyczne uczenie maszynowe” jeden z jego uczestników

Cyberbezpieczeństwo zwykle ma dwa bieguny, mam na myśli to, że ma dwie skrajności. Pierwszy i chyba najbardziej popularny biegun – to totalna ignorancja. Drugi to próba naprawienia i zrozumienia, że sytuacja jest kiepska, kiedy już coś poszło nie tak. Pomyślałem, że warto poruszyć ten temat również w kontekście tak zwanej sztucznej inteligencji, bo te dwa tematy już zaczynają się krzyżować.

Uczenie maszynowe samo w sobie jest narzędziem i to ludzie decydują, gdzie je zastosować. Z jednej strony uczenie maszynowe może być pomocne do wykrywanie cyberprzestępstw, z drugiej strony może być użyte do popełnienia cyberprzestępstwa. Przy czym obawiam się, że po tej drugiej stronie zazwyczaj rzeczy dzieją się szybciej.

Będziemy rozmawiać między innymi na temat ataków DDoS. To jest sytuacja, kiedy nagle na stronę firmy „wchodzi” dużo ludzi (zwykle są to zawirusowane komputery) i serwer nie wytrzymuje takiego ruchu, w wyniku czego strona pada. Oczywiście niedostępność strony nie wygląda dobrze wizerunkowo. To tylko jeden z problemów. Pamiętam jak jeszcze jakiś czas temu byłem zaangażowany w SEO (czyli optymalizację stron pod wyszukiwarki, zwykle pod Google).

Są firmy, dla których zajęcie wysokiej pozycji w Google jest kluczowe dla biznesu. Natomiast pierwsza pozycja jest tylko jedna, a chętnych jest dziesiątki czy nawet setki i niestety czasem konkurencja robiła mało etyczny ruch – zamawiała atak DDoS, w wyniku którego strona była niedostępna przez kilka godzin lub nawet czasem dni. To powodowało sytuację, że Google uznawał stronę za mało stabilną i decydował, że kogoś innego trzeba wpuścić na pierwszą czy drugą pozycję. Mówię to dlatego, że jest wiele płaszczyzn jak cyberprzestępstwo może popsuć nam humor.

Zaprosiłem Wojtka z GreyWizard, żeby podzielił się swoim doświadczeniem.

Cześć Wojtek, przedstaw się kim jesteś, czym się zajmujesz, gdzie mieszkasz?

Cześć, nazywam się Wojtek Maciejewski, pracuję w firmie Grey Wizard zajmującej się cyberbezpieczeństwem. Jestem odpowiedzialny za ekspansję międzynarodową i przy okazji pomagam prowadzić projekt coinpaprika.com, który też jest częścią Grey Wizard. Mieszkam w Poznaniu.

Brzmi ambitnie. Co ostatnio czytałeś?

Ostatnio czytałem książkę pod tytułem „Mindhunter”, na podstawie której powstał ostatnio serial Netflixa, a opowiada historię oficera FBI, który stworzył cały program profilowania seryjnych morderców.

A druga książka to „Rise of the Robots: Technology and the Threat of a Jobless Future” – podejmuje taki temat, który mnie zawsze interesował, kiedy chciałem zostać ekonomistą, a ostatnio bardzo się boję o przyszłość ludzkości, o to, czy ludzie znajdą zatrudnienie w czasach, gdy roboty przyjmują coraz więcej pracy – bardzo polecam tę pozycję.

I jaki masz wniosek po przeczytaniu tej drugiej pozycji, znajdą pracę czy nie?

Wydaje mi się, że znajdą. Na początku byłem do tego sceptycznie nastawiony, wydawało mi się, że po tej rewolucji ciężko będzie znaleźć pracę, ale teraz sądzę, że skończy się to tak, jak po ostatniej rewolucji przemysłowej – znajdą się inne zajęcia dla ludzi. Problem może powstać wtedy, gdy rzeczywiście ludzie nie będą musieli pracować – problemem będzie, jak zrobić tak, by ludzie nie pracujący, czuli się potrzebni w społeczeństwie, będzie to największe wyzwanie nadchodzących lat, ale jeszcze długo do tego.

Też uważam, że jest to jedno z największych wyzwań, które nas czeka. Nie jestem pewien czy musimy długo na to czekać, bo ten świat zmienia się bardzo szybko. Nasz dzisiejszy temat to cyberprzestępstwa. To jedno z największych zagrożeń obecnego świata, nawet mówi się, że trzecia wojna już się rozpoczęła, tylko odbywa się w innej przestrzeni – tej wirtualnej. Zaczniemy od początku, czym są cyberprzestępstwa i dlaczego stają się coraz bardziej niebezpieczne w naszych czasach?

Cyberprzestępczość z grubsza to łamanie prawa z użyciem komputera lub sieci komputerowej. Jest to nowa i jedna z najszybciej rozwijających się form przestępczości. Codziennie używamy internetu i ludzie umieszczają tam coraz więcej wartościowych rzeczy. Myślę, że docelowo chyba wszystko, co jest na papierze, znajdzie się na dysku komputera lub serwera podłączonego do internetu.

Danych jest coraz więcej. Microsoft przewiduje, że w 2020 roku w Internecie będzie 50 razy więcej danych niż w 2016. Dodatkowo mamy teraz miliony urządzeń IoT, które wszędzie wysyłają sygnały.

Dlaczego cyberprzestępczość powstała i dlaczego jest niebezpieczna?
Dla przestępców internet i komputery to wspaniały obszar ze względu na: anonimowość, szybkość i wygodę oraz brak granic. Z reguły ataki są przeprowadzane przez pojedynczych hakerów. W atakach hakerskich pomagają ostatnio dość popularne kryptowaluty, dzięki którym jeszcze zwiększamy anonimowość w przypadku, gdy haker będzie żądał okupu za odszyfrowanie komputera albo zaprzestanie ataków. Ryzyko dla hakerów jest minimalne, a wygrana może być liczona w milionach dolarów, o czym co jakiś czas słyszymy w mediach. Oni prawie nigdy nie zostają złapani, a to dlatego, że jurysdykcje nie pozwalają różnym agencjom jak FBI na ściganie hakerów w Chinach czy Rosji – jeżeli oni się tam znajdują, to w zasadzie są bezkarni. Trudno znaleźć dowody ataku hakerskiego, nie mamy odcisków palców i ciężko jest udowodnić, że akurat dana osoba przeprowadziła atak. Nie ma też zasobów, które pomagają znaleźć dowody na takie przestępstwa – ofiary przestępstw są zazwyczaj przestraszone, a organizacje państwowe często nie wiedzą, jak sobie z tym poradzić. Jeszcze jesteśmy na takim etapie, że nie wpływa to za mocno na gospodarkę, więc rządy nie podchodzą do tego na poważnie, ale myślę, że to się bardzo szybko zmieni.

Efekty tych ataków są takie, że ich ofiar jest już pół miliarda na całym świecie, czyli co siódma osoba korzystająca z internetu została ofiarą cyberprzestępstwa. Ludzie nie zdają sobie sprawy, że to jest poważne zagrożenie, no bo nikt nie chce o tym mówić. Firmy boją się o tym mówić, bo to nie jest w ich interesie. Z tegorocznego raportu KPMG wynika, że w Polsce 82% firm odnotowało jakiś cyberincydent. Dla porównania mogę powiedzieć, że w zeszłym roku w Polsce było 32 705 wypadków samochodowych, a incydentów cyberbezpieczeństwa prawie 2 miliony, a o tym się raczej nie słyszy.

W 2017 roku liczba zaobserwowanych w organizacji prób cyberataków, w porównaniu z poprzednim rokiem. Raport KPMG.

Około 40% firm odnotowało wzrost ataków w 2017 roku w porównaniu do poprzedniego, tak więc skala problemu jest ogromna, tylko się o tym nie mówi. Dodatkowo Państwa są zarządzane przez ludzi, którzy wychowali się w innej erze i nie zdają sobie sprawy z zagrożeń. Myślę, że obudzą się, gdy ich to dotknie.

Ta statystyka, którą podajesz, naprawdę robi wrażenie. Z jednej strony rządy państw nie zdają sobie z tego sprawy, z drugiej strony aktualnie jest wysyp start-upów, które próbują pomóc w walce z cyberprzestępstwami. Do nich należą takie firmy, jak DeepInstinct, Malwarebytes, Google ma również swój Chronicle, IBM stara się wykorzystać Watsona itd. Czym to jest spowodowane? Czy ilość cyberprzestępców faktycznie nagle wzrosła w porównaniu do tego, co było 5 lat temu, czy wzrosła świadomość?

Sądzę, że jedno i drugie. Start-upów związanych z cyberbezpieczeństwem jest coraz więcej. Obserwujemy ten rynek dość uważnie. Aktualnie powstaje wiele ciekawych rozwiązań. Jednak uważamy, że duża część z bardzo popularnych rozwiązań na rynku jest niewystarczająco bezpieczna i tu próbujemy znaleźć swoje miejsce z bardzo zaawansowanymi algorytmami nauczania maszynowego. Ostatnio testowaliśmy zabezpieczenia dostarczane przez bardzo popularną firmę i udało nam się je złamać w ciągu 7 minut, więc myślę, że jeszcze trochę zajmie, zanim te wszystkie technologie będą gotowe na ataki.

W ciągu ostatnich pięciu lat liczba cyberprzestępstw wzrosła diametralnie. W 2010 roku mieliśmy ponad 3 miliony rekordów, które wyciekły z baz danych, a w 2016 roku mamy już 3 miliardy. Rozkwita rynek baz danych. Przykładowo karta pacjenta na czarnym rynku kosztuje nawet do tysiąca dolarów, pewnie jest sprzedawana różnym firmom, które mają interes w tym, by wiedzieć, co się dzieje z Twoim zdrowiem. Na czarnym rynku możesz też bez problemu kupić takie dane jak informacje o karcie kredytowej czy login i hasło do popularnych portali streamingowych z filmami, czy muzyką, takie dane do logowania kosztują 3 dolary.

Aktualnie cyberprzestępczość jest uważana przez niektórych za zagrożenie numer 1 dla firm. W USA jest to najszybciej rosnąca kategoria przestępstw. Uważam, że firmy, które będą dobrze zabezpieczone, osiągną w przyszłości przewagę konkurencyjną, bo ich bazy danych nie będą wyciekały, a kontrahenci czy banki będą wiedzieli, że mają do czynienia ze stabilnym biznesem, przynajmniej jeżeli chodzi o bezpieczeństwo cyfrowe.

Niektóre rządy obudziły się w zeszłym roku i zaczynają tworzyć swoje własne armie, które destabilizują inne kraje. Dzięki temu napływa większy kapitał, hakerzy mają ochronę przed konsekwencjami ataków, a co za tym idzie, jest ich coraz więcej i automatycznie coraz więcej jest firm zajmujących się ochroną.

Podrążę trochę głębiej temat cyberprzestępstw. Jakie są ich rodzaje?

Podzielę je ogólnie z punktu widzenia motywacji. Najczęstsze są cyberprzestępstwa finansowe, czyli motywem przewodnim ataku hakera jest kradzież pieniędzy przez nieautoryzowany dostęp do konta, kradzież danych z kart kredytowych, podszywanie się pod kogoś, kradzież dokumentów. Kolejną kategorią jest cyberterroryzm, tutaj występują motywy polityczne, mające na celu zdestabilizowanie funkcjonowania konkurencyjnego rządu lub organizacji, przykładem mogą być Rosja i Ukraina.

Proste wymuszenia jest w stanie dzisiaj przeprowadzić osoba, która nie ma pojęcia o atakach hakerskich przez zamówienie w Internecie ataku typu DDoS, w wyszukiwarce Google można znaleźć profesjonalne firmy, które się tym zajmują. Taki atak się zamawia, wysyła się maila ze świeżo założonego adresu o treści: „prosimy o przelew takiej kwoty w bitcoinach”, a osoba atakująca jest nie do namierzenia. Dalej mamy cyberwojny – moim zdaniem najbardziej niebezpieczne ataki, które polegają na atakach na elektrownie, na paraliżowaniu infrastruktury kraju. Widzieliśmy takie ataki robione przez Izrael na Iran – ich program atomowy.

Mam nadzieję, że będzie ich coraz mniej, bo one są bardzo ryzykowne. Mamy również takie ataki, których celem jest komputer – zwykłe zarażanie komputera wirusem, złośliwym oprogramowaniem, czy ataki Denial of Service, które paraliżują działanie komputera. W ostatnim rodzaju cyberprzestępstw komputer jest używany jako narzędzie, czyli są to wszelkiego rodzaju oszustwa przeprowadzone za pomocą komputera, kradzież tożsamości, wojny informacyjne, phishing scams, spam, memy, gnębienie ludzi na Facebooku, używanie przez przemytników narkotyków komunikatorów szyfrujących informacje – to wszystko są cyberprzestępstwa.

Jeżeli chodzi o bardziej techniczne aspekty, najczęstsze są ataki typu malware, gdzie najczęściej szyfrowane są dyski komputerów, ataki typu DDoS, gdzie tysiące komputerów próbuje się nagle połączyć z serwerem i paraliżują jego funkcjonowanie oraz ataki aplikacyjne na systemy API, które są moim zdaniem najgroźniejsze i według Gartnera te ataki będą najczęstsze za kilka lat.

Już wcześniej wspomniałeś statystykach mówiących o 2 milionach cyberincydentów oraz kilku miliardach rekordów, które wyciekły, więc jest to zrozumiałe, dlaczego trzeba zająć się tym tematem. Skupmy się na tym głębiej. Jakie są możliwe skutki cyberprzestępstw i dlaczego nie można ignorować tych tematów?

Wyobraź sobie, że koszty katastrof naturalnych w zeszłym roku wyniosły około 300 miliardów dolarów, a koszty cyberataków w wersji optymistycznej to dwa razy tyle. Szwajcarska firma ubezpieczeniowa przewiduje, że koszty ataków wyniosą 1% globalnego PKB, więc jest to spora kwota, która warto się zainteresować. Skutki ataków DDoS to haracze – mamy firmową stronę internetową, która atakowana jest do momentu, w którym wysiadają serwery i strona przestaje działać, strona nie wstanie, dopóki haracz nie zostanie zapłacony. A jeśli zostanie zapłacony, to z reguły haker atakuje ponownie. Skutki botów to niszczenie modelu biznesowego firmy, kradzież kontentu, niesprawiedliwa konkurencja – boty wchodzą na strony ecommerce’ów, wypełniają koszyki produktami tak, że w magazynach nie zostaje nic dostępnego dla kolejnego użytkownika, przez co ten e-commerce nic nie sprzeda.

Tłumaczymy naszym klientom, że koszty związane z wyciekiem danych są wręcz astronomiczne, bo po takim wycieku danych z firmy, jej właściciel musi zatrudnić ekspertów od IT do przebudowy całej infrastruktury – musi być szybko przebudowana i zabezpieczona, żeby nie doszło do kolejnego ataku. Nie wspominając o tym, że niełatwo jest takich specjalistów znaleźć. Trzeba również zatrudnić prawników, bo jeżeli dane wyciekną, użytkownicy będą mieli pretensje, pozwą nas, tym bardziej że weszło RODO. Kolejny koszt to program ochrony danych osobowych dla osób, których dane wyciekły – trzeba poinformować wszystkie ofiary i upewnić się, że one zrozumiały, jakie są tego konsekwencje. Oczywiście kolejny koszt to utrata wizerunku marki czy utrata klientów.

IBM zrobiło w zeszły roku ciekawe badanie, w którym policzyli, że 160 dolarów to jest średni koszt rekordu, który wycieknie. Jeżeli ktoś ma e-commerce, może sobie bardzo łatwo policzyć własny koszt wycieku danych, mnożąc 160 dolarów razy ilość posiadanych rekordów, czyli ilość zarejestrowanych użytkowników. Oczywiście te koszty się wahają w zależności od państwa, najdroższe są wycieki danych finansowych oraz danych dotyczących zdrowia pacjentów, czyli karty pacjentów.

Jeżeli ktoś ma e-commerce czy bazę danych, która zawiera 10 tysięcy rekordów, to koszt takiego wycieku jest szacowany średnio na około 2 miliony dolarów. Średni koszt wycieku danych przy 50 tysiącach to byłoby około 7 milionów dolarów. Tak więc są to ogromne kwoty.

Jak mówisz o skutkach, to brzmi bardzo przerażająco. Z drugiej strony jest wrażenie, że to dzieje się gdzieś obok i nas nie dotyczy. Chciałbym posłuchać trochę o statystykach, już podałeś przykład z IBM i właśnie IBM podaje, że w ciągu dnia walczą nawet z 200 tysiącami ataków? Jak to wygląda u Was, czy możesz podać, ile ataków macie dziennie czy tygodniowo?

Trzeba rozróżnić incydenty od ataków. Jeżeli IBM mówi o 200 tysiącach ataków, to sądzę, że mówią o incydentach, bo niemożliwe, by zatrzymali 200 tysięcy ataków. Nie ma takiej definicji, która rozgranicza incydent, podczas którego bot próbuje ukraść jakiś kontent, od takiego poważnego ataku DDoS, który paraliżuje infrastrukturę. Przykładowo wczoraj zatrzymaliśmy 27 tysięcy incydentów, a 11 maja 110 tysięcy, więc połowę tego, co IBM. Takich poważnych ataków DDoS rzędu 50GB/s, które sparaliżują pewnie każdy serwis w Polsce, zatrzymujemy kilka rocznie. Tych mniejszych rzędu 3-5GB/s to nawet nie analizujemy, więc nie znam dokładnej statystyki.

Myślę, że wiemy już, czym są cyberprzestępstwa. Zmieńmy teraz temat na uczenie maszynowe i sztuczną inteligencję. To jest potężne narzędzie, które może być zastosowane przez obie strony. Co się zmieniło w świecie cyberprzestępstw, w momencie, gdy pojawiło się uczenie maszynowe?

W 2016 roku zmieniło się bardzo dużo w kwestii ochrony przed atakami. Już w 2014 roku postanowiliśmy, że nasz software będzie bazował na nauczaniu maszynowym. Jeżeli chodzi o cyberprzestępstwa, to jeszcze nie zauważyliśmy, żeby hakerzy zaczęli używać sztucznej inteligencji czy nauczania maszynowego, ale wydaje mi się, że ten rok będzie pierwszym, w którym takie ataki będą miały miejsce. Systemy ochrony pewnych serwisów są coraz bardziej zaawansowane, więc coraz bardziej zaawansowane są też ataki. Wydaje mi się, że zmienią się cztery główne rzeczy.

Pierwsze to ataki malware, czyli programów, które chcą zrobić jakąś szkodę w firmie, na komputerze lub serwerach. Te programy będą dużo bardziej zaawansowane, będą reagowały w odpowiednich momentach, będą próbowały przechodzić różne zabezpieczenia. Druga rzecz, która się moim zdaniem zmieni to, że dużo bardziej inteligentne będą botnety, robiące ataki DDoS, co polega na tym, że z sieci zarażonych komputerów na całym świecie, po naciśnięciu jednego guzika przez hakera, zaczynają się łączyć ze stroną. Podejrzewam, że pod koniec roku zaczną się uczyć, kiedy zostaną zablokowane, a kiedy nie. To stworzy moim zdaniem duże zagrożenie dla firm, nawet tych ochranianych przez najlepsze rozwiązania.

Kolejną rzeczą, która się na pewno zmieni, że phishing, czyli wysyłanie e-maili, namawianie ludzi do kliknięcia linków, by uzyskać od nich jakieś informacje, będzie dużo bardziej zaawansowany. Tak samo, jak mamy spersonalizowane kampanie e-mailingowe, tak samo będziemy mieć spersonalizowane ataki e-mailingowe. Jednym ze sposobów zatrzymywania botów na stronach jest wysyłanie CAPTCHA, z którą boty na razie sobie nie radzą, ale sądzę, że może w tym roku, ktoś wymyśli, jak sobie z tym radzić, a może już wymyślił.

Takie najprostsze CAPTCHA już całkiem łatwo można złamać, te trudniejsze są pewnym wyzwaniem. Wspomniałeś na początku rozmowy, że roboty zastąpią ludzi.

Dyrektor techniczny McAffee Steve Grobman twierdzi, że uczenie maszynowe lub tak zwana sztuczna inteligencja nie zastąpi ekspertów od bezpieczeństwa. Zastanawiałem się nad tym… Z jednej strony jest to prawda na dzień dzisiejszy i prawdopodobnie taki model potrzebuje jeszcze trochę czasu, żeby się nauczyć, ale jak to będzie „jutro”? Czy to nie będzie tak, że maszyna będzie walczyć z maszyną? Co o tym myślisz?

To bardzo ciekawe pytanie. Uważam, że uczenie maszynowe/sztuczna inteligencja na chwilę obecną ma swoje ograniczenia. W krótkiej perspektywie moim zdaniem nie zastąpi ekspertów od bezpieczeństwa. Tym bardziej, jeśli mówimy o osobach wysoko wykwalifikowanych – mamy zespół inżynierów, który 24h na dobę czuwa nad sytuacją w firmach, które ochraniamy.

W tej chwili uczenie maszynowe eliminuje niektóre czynności – te najbardziej powtarzalne, które są dość dobrze zdefiniowane i wymagają najmniej innowacji, dzięki czemu osoby zajmujące się cyberbezpieczeństwem mogą skupić się na najbardziej interesujących rzeczach, a „żmudna praca” wykonywana jest przez komputer. Jednak skoro wykorzystujemy algorytmy uczenia maszynowego do pomocy ekspertom, to równie dobrze atakujący mogą próbować oszukać te algorytmy innymi algorytmami uczenia maszynowego. I pewnie z czasem to zjawisko będzie postępować.

W długiej perspektywie z kolei wszystko jest możliwe, z czasem coraz trudniej jest oszacować, jakie przełomy mogą nastąpić. Ekspertów może na razie całkowicie nie zastąpi, ale prawdopodobnie dzięki uczeniu maszynowemu będziemy potrzebować mniej ekspertów/ludzi od bezpieczeństwa. Takich ludzi jest mało na rynku, więc mam nadzieję, że ta technologia wypełni te braki.

Wspomniałeś o inżynierach, podawałeś statystyki, myślę, że warto powiedzieć, czym się zajmuje się firma Grey Wizard i jakiego rodzaju problemy próbujecie rozwiązać?

Jesteśmy chyba jedyną europejską firmą, zajmującą się ochroną stron internetowych i sieci IoT przed atakami hakerskimi. Większość naszych klientów to firmy, które korzystają z ochrony stron internetowych. W naszym portfolio mamy takie produkty, jak WAF i API, które dbają o bezpieczeństwo danych.

Mamy zbudowaną infrastrukturę do ochrony przed atakami DDoS, które paraliżują infrastrukturę klienta. Mamy produkty, które chronią przed wkradaniem się na konta, czyli tak zwanymi atakami Brute Force czy credential stuffing, podczas których haker próbuje różnych loginów i haseł w serwisach czy sklepach internetowych po to, żeby w końcu wkraść się na czyjeś konto. Chronimy naszych klientów przed botami, czyli szkodami w modelu biznesowym. I, jak wspomniałem wcześniej, ochraniamy całe systemy sieci IOT, czyli dbamy o to, żeby nikt się nie wkradał i żeby te urządzenia bezpiecznie się komunikowały.

A czy możesz w skrócie wyjaśnić, pomijając zaawansowane szczegóły techniczne, jak to działa pod spodem?

Jeżeli chodzi o ataki DDoS, to mamy zbudowaną infrastrukturę serwerów i bardzo wydajnych łączy od wielu dostawców w całej Polsce, które są w stanie takie ataki zatrzymać. Dodatkowo mamy reguły statyczne, które zatrzymują ataki, regułki od organizacji OWASP, jak również patche od zewnętrznych dostawców, takich jak Magento czy WordPress. Te regułki zatrzymują 80% ataków. I ostatnie około 20% zatrzymuje nauczanie maszynowe oraz analiza behawioralna.

Jak to działa? My podchodzimy inaczej do klientów niż pozostali dostawcy. W momencie, gdy klient podłączy się do naszej infrastruktury, my uczymy się, jak wygląda jego ruch, analizujemy 63 różne metryki, takie jak szczegółowa analiza cookies, sprawdzamy ilość żądań na dany kraj, poziom podobieństwa requestów, liczbę logowań do API na minutę itd. Jak już mamy wymodelowane te metryki po 3 dniach, mamy gotowy model ruchu, to włączamy klienta w tryb ochrony. Jeżeli coś nie pasuje do modelu w tym trybie, to nasz system automatycznie reaguje, wysyłając CAPTCHA, JSCheck albo wprowadza blokadę IP.

Podam Ci przykład, jak to działa. Załóżmy, że o godzinie dwudziestej na Twoją stronę wchodzi 100% ludzi z Polski i nagle pewnego dnia 70% ruchu pochodzi z Wietnamu. Nasz model wykryje, że ilość żądań na dany kraj się nie zgadza, bo normalnie są to ludzie z Polski, a nie z Wietnamu, więc wyśle wszystkim, którzy są z Wietnamu CAPTCHA, JSCheck albo zablokuje ich IP w zależności od stopnia pewności, że to jest zagrożenie.

Czy te dodatkowe działania nie spowalniają działania strony?

My jesteśmy takim firewallem, czyli filtrem między użytkownikiem a serwerem strony. Klasyfikacja tego, czy dany request jest zagrożeniem czy nie, trwa około 3 ms, więc tak naprawdę to nie spowalnia. Twoje pytanie jest bardzo dobre, bo wszyscy klienci się o to pytają i często zaskakujemy ich odpowiedzią, że tak naprawdę przyspieszamy działanie ich strony. A to dzięki temu, że przez naszą sieć CDN, na której cachujemy statyczny kontent wszystkich stron, jesteśmy w stanie „podać” kontent końcowemu użytkownikowi dużo szybciej niż jego własne serwery. Jeżeli ktoś podłączy się do naszej infrastruktury, to jest nie tylko bezpieczny, ale też jego strona działa szybciej.

Bardzo fajny gratis. A na ile skutecznie to działa?

Tak skutecznie, że jeden z największych portali gamingowych na świecie, a przypominam, że branża gamingowa jest bardzo często atakowana, przeniósł się od potentata w branży cyberbezpieczeństwa do nas i jest z nami od 1.5 roku, bo tylko my potrafiliśmy rozwiązać jego problemy. A od dwóch lat jeszcze żaden klient od nas nie odszedł, więc wydaje mi się, że są zadowoleni z naszych usług.

Bardzo dziękuję Ci Wojtku za podzielenie się wiedzą. Ostatnie pytanie na dziś: jak można Cię znaleźć w sieci?

Można mnie znaleźć pewnie na milion sposobów. Zapraszam na LinkedIn oraz na naszą stronę greywizard.com.

Dziękuję jeszcze raz za czas, który poświęciłeś na rozmowę i mam nadzieję, że ta świadomość u osób korzystających z Internetu wzrośnie i będziemy ostrożniejsi, jednak byle bez przesady.

Dziękuję bardzo za zaproszenie.

Czy ten odcinek trochę uświadomił Ci ważność tematu? Być może będzie to odebrane jako straszenie, ale chodzi mi o coś innego. Warto zdawać sobie sprawę, że internet na dzień dzisiejszy przypomina dziki zachód. Dlatego trzeba zadbać o bezpieczeństwo Twojej firmy. Myślę, że ten wątek będę kontynuował w przyszłości, ale mam nadzieję, że na początek wystarczy :).

Teraz jestem na takim etapie w życiu, kiedy mam to, o czym tak dawno marzyłem – dużą przestrzeń na twórczość. Muszę teraz się jedynie nauczyć wracać z biura do domu najlepiej wieczorem :).

Zajmuję się między innymi organizacją DataWorkshop Tour oraz DataWorkshop Club Conf. Długo myślałem, jak najlepiej zorganizować konferencję, kogo zaprosić jako prelegenta. Okazuje się, że temat jest dość skomplikowany, bo jak myślę o tym wszystkim, co mi się nie podobało na innych konferencjach, to uświadamiam sobie, że jest to spore wyzwanie. Z drugiej strony, spędzając kolejne dni na rozważaniach, widzę światełko na końcu tunelu. Bardzo inspirujące jest to, jak działa nasz mózg. Już mamy prawie wszystkich prelegentów, będzie tam sporo ciekawych osób (właśnie dlatego ich zapraszamy). Będą CEO, CTO, VP. Ludzie, którzy pracowali w Google, Facebooku, Allegro, jak i pracujący obecnie w start-upach. Każdy z nich opowie swoją historię, o porażkach i sukcesach, co najbardziej się sprawdziło i czego się nauczył po drodze. Podzielą się również lifehackami.

Kurs – praktyczne uczenie maszynowe.

Mam jeszcze dwie wiadomości na temat innych konferencji.

4 lipca w Warszawie odbędzie się konferencja o nazwie Rakieta. Będzie tam dużo ciekawych prelegentów z największych firm czy instytucji w Polsce. Pojawią się różne tematy, zaczynając od architektury, poprzez automatyzację procesów i robotyzację. Oczywiście jednym z tematów będzie również uczenie maszynowe i tak zwana sztuczna inteligencja. Mam okazję podzielić się swoim doświadczeniem, a mianowicie opowiem o realizacji jednego z moich projektów zastosowania uczenia maszynowego. Mniej będzie informacji technicznej, ale dość sporo życiowych wniosków.

Jeszcze chcę wspomnieć o jednej konferencji: w dniach od 2 do 5 lipca we Wrocławiu odbędzie się konferencja WhyR?. Myślę, że to będzie szczególnie interesujące dla technicznych osób zainteresowanych językiem R.

Kontynuuję tradycję dodawania jednej opinii uczestnika drugiej edycji kursu praktyczne uczenie maszynowe. Tym razem będzie to Łukasz. Jest to młody człowiek, który ma dużo pomysłów i energii. Jeśli wszystko potoczy się w dobrym kierunku, myślę, że będzie mógł sporo osiągnąć. Pięknie jest sobie przypomnieć w pewnym sensie siebie, jak jeszcze było mniej obowiązków, nie było rodziny, dzieci… wtedy wszystko było łatwiej. Z drugiej strony dzięki rodzinie poznajesz życiowe priorytety. Już nie przedłużam i zapraszam do wysłuchania.

Cześć Łukaszu. Przedstaw się, kim jesteś, czym się zajmujesz, gdzie mieszkasz.

Cześć Vladimir. Na co dzień pracuję jako programista głównie pisząc w JVM-owych technologiach. Zaczynałem w Javie, a teraz w większości przypadków jest to Kotlin, o wiele wygodniej się w nim pisze, a do tego czasami wykorzystuję sobie Sparka do wyciągania większych ilości danych, Spark jest to taka biblioteka, framework do przetwarzania większej ilości danych – big data. Moim pierwszym językiem właśnie była Java, a reszty nie uczyłem się z tutoriali tylko poprzez pisanie kodu. Pochodzę z Bydgoszczy, obecnie mieszkam w Poznaniu, a programowaniem zajmuję się od około trzech lat. W wolnym czasie próbuję rozwijać się w różnych dziedzinach, na przykład pół roku temu zacząłem pisać bloga.

Z tego co pamiętam, pracujesz w Allegro.

Tak.

A co ostatnio czytałeś?

Ogólnie mam taki dobry lub zły nawyk czytania wielu książek naraz, mogę wymienić tutaj niektóre. W zależności od pory dnia, nastroju staram się czytać różne rzeczy i też sporo książek nadrabiam audiobookami, co pozwala przeczytać całkiem sporą ilość książek. Słucham audiobooków, idąc na przykład do pracy, do sklepu, czy jeżdżąc rowerem. No i pierwszą taką książką, którą dopiero zaczynam czytać jest „Algorithms to Live By”. Książka omawia, jak działają algorytmy oraz jak te algorytmy nie są ograniczone tylko do świata wirtualnego, ale jak też pomagają nam w podejmowaniu lepszych decyzji na co dzień, jak pomagają nam zoptymalizować nasze życie.

Inna książka, którą już prawie kończę, jest „Sapiens: A Brief History of Humankind” i jest to również świetna książka, która w skrócie opowiada, jak to się stało, że jesteśmy tu, gdzie jesteśmy, jak działamy, dlaczego, jak z pozycji przeciętnego gatunku przeszliśmy na ten najbardziej dominujący i pomimo tego, że nasz gatunek ludzki istnieje jakiś czas, to jak w zaledwie kilka lat udało się nam osiągnąć to, co osiągnęliśmy, jak stworzyliśmy całą tę cywilizację. Daje nam do myślenia, czym jest właściwie ewolucja, czy może jesteśmy tylko błędem statystycznym w całym tym procesie ewolucji, czy może właśnie to jest ta prawdziwa ewolucja – bardzo fajna książka.

Jeszcze jedna książka, którą przeczytałem ponownie w tym roku, bo za pierwszym razem czytałem ją rok wcześniej, to „The War of Art”. Przesłuchałem tylko audiobooka. Jest to mega motywująca książka, która opowiada o czymś takim jak resistance, nie będę się rozwodził, co to jest, ale naprawdę zrozumienie tego przynajmniej w jakiejś części zmienia to, jak myślimy, jak pracujemy i działamy.

Kolejna książka to „Tools of Titans”, czytałem ją w sumie ponad rok i jest w niej bardzo dużo różnych rzeczy, są tam wglądy do tego, jak żyją ludzie i co robią ludzie, którzy osiągnęli szczyt swoich możliwości w swoich dziedzinach. Można dowiedzieć się, jakie nawyki ma większość z tych ludzi – 80% z nich na przykład ma codzienny rytuał związany z mindfulness, na przykład medytują. Zaskakujący fakt – mężczyźni nie jedzą rano śniadania, a kobiety jedzą. Spora część z nich również dba o to, aby mieć jak najlepszy sen, więc używają różnych mat chłodzących. Większość z nich wypowiada się dobrze na temat wcześniej wymienionej przeze mnie książki „Sapiens: A Brief History of Humankind”, a także „Man’s Search for Meaning”. Ta druga książka opisuje traumatyczne przeżycia z obozów koncentracyjnych, między innymi Auschwitz. Myślę, że to jest ostatnia książka, jaką mogę wymienić. Ja czytam je tak równolegle, kilka na raz.

Część z tych książek czytałem, część sobie zapamiętam i postaram się dodać do listy książek, które warto przeczytać. Powiedz teraz, jak zaczęła się twoja przygoda z uczeniem maszynowym. Wspomniałeś już o big data, ale to jest tak, że mamy dane, być może jest ich wiele, ale nadal to jeszcze jest krok przed uczeniem maszynowym. Co Cię skłoniło do zainteresowania się machine learningiem?

Biorąc pod uwagę samo rozmyślanie o sztucznej inteligencji, to powiedziałbym, że interesuję się tym tematem większą część mojego życia, ale to tylko na poziomie oglądania filmów science-fiction, więc były to raczej mocno zajawkowe rzeczy. To, że faktycznie mógłbym się tego uczyć, nawet nie przychodziło mi do głowy. Nie mniej samo programowanie zmieniło moje myślenie wielokrotnie o 180 stopni i miały na to wpływ również książki, jakie czytam. Interesuję się tym, bo uważam, że warto zainwestować trochę swojego czasu w rozwój w tym kierunku, bo IT rozwija się w bardzo szybkim tempie i chciałbym mieć takie podstawy do tego, żebym, jeśli kiedyś w życiu nadarzy mi się okazja do czegoś fajnego związanego ze sztuczną inteligencją, był właśnie na to przygotowany.

Uczestniczyłeś w kursie „Praktyczne uczenie maszynowe” w DataWorkshop. Powiedz, co Ci się najbardziej spodobało w tym kursie.

Na pewno fajne było w tym kursie to, że korzystaliśmy z notebooków, co pozwoliło stworzyć takie fajne interaktywne środowisko do uczenia się i super było to, że uczyłeś na podstawie odniesień do rzeczywistości, na podstawie takich anegdotek, opowiadań z życia. To było fajne, bo właśnie nasz umysł ewoluował dzięki takim opowieściom. Jeżeli czegoś nie rozumieliśmy tysiące lat temu, to tworzyliśmy do tego opowiadanie, żeby wytłumaczyć na przykład jakieś zjawisko i przekazywaliśmy to kolejnym pokoleniom i właśnie w twoim kursie było coś podobnego. Inna rzecz, że Twoje materiały były ułożone od najłatwiejszego do coraz trudniejszego, złożoność tych notebooków rosła wykładniczo i za każdym razem było dodawane coś nowego, to też mi się podobało.

Czy cokolwiek zaskoczyło Cię w kursie?

Jedna rzecz, która mnie zaskoczyła, to, że jest on aż tak bardzo rozbudowany i aż tak bardzo nieszablonowy, bo jednak większość kursów jest ułożona trochę inaczej. Twój kurs nie był kopią innych popularnych kursów, był dość skrupulatnie przemyślany. Do tego fajne było też twoje podejście, bo na każdym kroku pytałeś, co można ulepszyć. Mimo że to jest gotowy produkt, to nadal ulepszasz.

Powiedziałeś, że pracujesz z Javą – jak ktoś nie wie, to jest język programowania. Natomiast w kursie używaliśmy Pythona i na ile dla Ciebie trudne było przejście z Javy na Pythona, czy już wcześniej miałeś okazję pracować z Pythonem?

Tak jak mówiłem, wcześniej pracowałem trochę w Sparku to jest biblioteka, framework do przetwarzania większych ilości danych i jest on w Pythonie. Na co dzień raczej nie pracuję w Pythonie, raczej siedzę w tych JVM-owych technologiach, ale Python raczej nie był zbyt dużym problemem.

Pewnie używałeś nakładki PySpark?

Tak, dokładnie.

Teraz takie praktyczne pytanie. Jaki jest następny krok, co będziesz robić z tą wiedzą, którą zdobyłeś podczas kursu?

Już wykorzystałem trochę tę wiedzę, bo kilka dni temu uczestniczyłem w takim wewnątrzfirmowym hackathonie i prawdę powiedziawszy jeden dzień, to było trochę mało, żeby zrobić coś sensownego, przynajmniej na moim obecnym poziomie, ale przynajmniej wiedziałem, co się dzieje.

Czy planujesz zrobić jakiś własny projekt albo jakiś inny projekt w ramach firmy?

W firmie prawdopodobnie wykorzystam zdobyte umiejętności, jeszcze nie wiem, w jaki dokładnie sposób, ale prawdopodobnie coś się uda zrobić. Mój najbliższy plan to, żeby przerobić jeszcze raz wszystko, podczas tego zrobić sobie notatki i wrzucić to na swojego bloga.

Jeżeli chodzi o blog, to w trakcie kursu bardzo polecam dzielić się wiedzą, bo właśnie wtedy najlepiej człowiek się uczy, tak już jesteśmy zbudowani. Wiem, że od niedawna prowadzisz blog, więc powiedz, gdzie można znaleźć Twojego bloga i o czym dokładnie piszesz.

Można mnie znaleźć na braintelligence.pl. Piszę o różnych rzeczach – o Javie, chcę pisać trochę o rozwoju osobistym i o sztucznej inteligencji – także po prostu piszę o wszystkich rzeczach, które mnie interesują lub które są dla mnie ciekawe.

Bardzo dziękuję ci za Twój czas i chęć podzielenia się swoją opinią. Życzę Ci dużo czytelników i oczywiście, żeby Twój rozwój szedł do przodu. Mam nadzieję, że za jakiś czas będzie okazja, żeby się spotkać i zobaczyć, że jesteś mistrzem uczenia maszynowego.

Dzięki.

Vladimir

Dodaj komentarz Anuluj pisanie odpowiedzi