Jacek Kawalec - Od Wirtualnej Polski do sztucznej inteligencji
Streszczenie odcinka
- Przedstawienie Gościa
- Jak definiujesz siebie w IT? Jako biznesmen, organizator, specjalista, inżynier?
- Jak zaczęła się Twoja historia w IT?
- Skąd wziął się pomysł na portal Wirtualna Polska?
- Czego nauczyłeś się pracując nad Wirtualną Polską?
- Czy trudno było rozpocząć nowy projekt po przygodzie z Wirtualną Polską?
- Na czym polegał projekt Popler?
- W jaki sposób zainteresowałeś się sztuczną inteligencją?
- Na czym polega Twoja praca w Voicelab?
- Czym jest Digital Innovation Hub?
- Gdzie widzisz najciekawsze obecnie perspektywy w IT?
Transkrypcja odcinka
Cześć. Witam Was w kolejnym odcinku podcastu Stacja IT. To już 39. odcinek po pewnej przerwie w nagrywaniu. Możemy jednak powiedzieć, że rozpoczyna się nowy sezon naszego podcastu. Mamy 2021 r., więc zastanawiałem się nad nieco inną jego formułą – stąd też ta przerwa w nagrywaniu, spowodowana także nowymi projektami w firmie, którymi trzeba było się zająć. Pomyślałem, że w tym sezonie porozmawiamy o biznesie w IT, o tym, jakimi ścieżkami można podążać, żeby dość do własnej firmy, rozwijania własnego biznesu. Pomysł na ten sezon, to, po pierwsze, podzielenie się własnymi doświadczeniami z tego obszaru, a po drugie – rozmowy z osobami, które są prezesami, członkami zarządów, startupowcami, osobami, które takie własne biznesy w swojej karierze w IT rozwinęły.
Zapraszam Was do wysłuchania tego odcinka i pozostałych, które można śledzić, subskrybując w swojej aplikacji kanał do słuchania podcastów na platformach typu Spotify, Apple, iTunes czy też po prostu oglądając go na YouTubie. Całą listę odcinków znajdziesz na stacja.it/podcast.
W dzisiejszym odcinku porozmawiamy z Jackiem Kawalcem, współzałożycielem Wirtualnej Polski.
Cześć, Jacek.
Cześć.
Dzięki wielkie, że zgodziłeś się z nami porozmawiać i znalazłeś na to czas. Dziś rozmawiamy w kontekście tworzenia własnego biznesu i tego, jak to wyglądało z twojej perspektywy. Pozwolę sobie na początku powiedzieć kilka słów o tobie: Jacek Kawalec studiował psychologię na Katolickim Uniwersytecie Lubelskim, był tłumaczem, asystentem reżysera teatralnego, programistą, a także kierował projektami. Pracował w Polsce, w Holandii i w USA. Jest współzałożycielem Wirtualnej Polski, gdzie odpowiadał za rozwój technologii. W 2010 r. pojawił się projekt Popler umożliwiający streaming wideo, a od 2012 r. firma VoiceLab specjalizująca się w technologii rozpoznawania mowy. Najnowszy projekt Jacka to Digital Innovation Hub, inicjatywa finansowana przez Ministerstwo Rozwoju. Powiedz, czy to są prawdziwe informacje?
Tak. Informacje są prawdziwe, w miarę zgodne z tym, co było. Startupów, w których pracowałem, było więcej. Wraz Maćkiem Grabskim byłem zaangażowany w fundusz baz. Natomiast struktura tego, co powiedziałeś, mniej więcej odpowiada dobrej narracji historycznej.
Jak to się w ogóle stało, że znalazłeś się w IT, skoro studiowałeś psychologię i pracowałeś jako tłumacz?
Wydaje mi się, że był to przypadek kwalifikowany. Ludzie często nie wiedzą, co chcą robić w życiu. Mam w tej chwili w domu 16-latkę, która jest w podobnej sytuacji. Niektórzy od urodzenia mają iskrę bożą i wiedzą, że chcą być muzykiem lub lekarzem, i to się rzadko zdarza, natomiast często ludzie do późnych lat nie wiedzą, co chcą robić, albo nie wiedzą, czy to, co robią, jest ich powołaniem. Ja studiowałem psychologię. Z perspektywy czasu wiem, że lubię tę dziedzinę. Uważam, że to było dobre doświadczenie, w fajnym czasie. Studia są w ogóle bardzo potrzebne do rozwoju osobowościowego. Natomiast jak wyjechałem do Holandii, to faktycznie zajmowałem się tłumaczeniami z nieżyjącym już, świetnym reżyserem Jerzym Grzegorzewskim, który później stał się dyrektorem Teatru Narodowego. I to było dobre doświadczenie ze względu na ludzi, z którymi się spotykałem również w Holandii. Natomiast to były rzeczy ad hoc. Już wtedy wydawało się, że technologia, informatyka ma przyszłość i że znajdę fajną, stosownie płatną pracę.
Zaczynałem jako programista. Uważam, że każdy, kto zajmuje się informatyką, powinien nim zostać. Im dłużej utrzyma się to doświadczenie, tym lepiej. Tendencja jest obecnie taka, że idzie się bardzo wąsko i jest się coraz lepszym programistą, specem od wąskich tematów – na szczęście w Polsce można z tego dobrze wyżyć. Kiedyś było inaczej. Nie można było wyspecjalizować się w jakiejś bardzo wąskiej dziedzinie, bo nie było na to rynku, poza Stanami Zjednoczonymi, gdzie ta wysoka specjalizacja praktycznie od zawsze była dobrze wynagradzana. Ja pracowałem w Holandii w bardzo ogólnych tematach, natomiast gdy pracowałem w Stanach Zjednoczonych w firmie Oracle, to zatrudnialiśmy tam ludzi, którzy przez ostatnie 15 lat tym się zajmowali, byli np. administratorami bazy danych Oracle DBA, dostawali setki dolarów za godzinę. I tak pracowali latami, mając bardzo wąską specjalizację. Przy budżetach amerykańskich jest to możliwe, natomiast w Europie i w Polsce tak jest dopiero teraz. Tendencja jest taka: albo iść wąsko i być specjalistą w jakiejś dziedzinie, albo wspinać się po kolejnych szczeblach drabinki i kompetencji, oddalając się jednocześnie coraz bardziej od właściwych umiejętności w stronę zarządzania projektami, i wtedy to doświadczenie z programowania jest dobre; bo rozmawiałem o tym z inżynierami, rozumiem, co oni mówią, jestem w stanie oszacować, skrytykować, widzę ryzyka, zagrożenia.
Ogólnie, pomimo że studiowałem psychologię, lubię i szanuję podejście inżynierskie, takie, w którym trzeba coś zrobić. Ludzie często mają przeświadczenie, że to jest tak duże albo drogie. Ja tego nie widzę. Nieważne, co to jest, można to przecież zacząć robić w jakiejś tam formie, żeby przynajmniej oszacować problem. Nawet jeśli tego nie zrealizujemy, nie będziemy produkowali tysięcy samochodów miesięcznie, to dowiemy się, co to znaczy w ogóle zrobić samochód. My jesteśmy na szczycie jakiejś piramidy, ktoś coś zrobił przed nami, my to poprawiamy, taki continuous improvement, i w zarządzaniu, i w technologii. Ja lubię robić taką analizę problemów. Chcę wiedzieć wszystko od razu i jak ma się to zakończyć. Później można wrócić do początku i zobaczyć w drugą stronę takie dwukierunkowe przebiegi. Najpierw budujemy sobie szkic tego, co należałoby mieć, żeby dojechać do celu z danym projektem, a później, jak już wiemy, co ma być na końcu i mamy wyczucie tego, to możemy zacząć się cofać, by zobaczyć, czy nasz plan się spełnił.
W tej drodze do zarządzania coraz bardziej idzie się w stronę przywództwa czy bycia liderem, gdzie coraz mniej jest praktycznych zadań, takich, że muszę coś napisać, opracować, a coraz więcej energii zajmuje ustalenie jakiegoś kierunku. Na przykład w tej chwili w Uberze widzimy taką zmianę warty: był jeden szef – właściciel, teraz jest kto inny, w zasadzie niewiele się o tym słyszy. Nie ma gwałtownych ruchów, oni niczego nie zmieniają. Bo w tej chwili u sterów jest tam ktoś, kto bardzo spokojnie i w sposób zbalansowany ma tę wizję, trzyma się jej i daje jej czas na to, żeby ona się zrealizowała, stoi na straży tego. To nie wymaga dużej ilości energii mentalnej, żeby organizować tę grupę ludzi, żeby ten cały statek, jakim jest firma, nie dawał pokus, że trzeba robić coś, czego nie powinniśmy. Żeby skupiać się na tym, co w tej chwili jest ważne. Wiem, że mówię w sposób bardzo ogólny, mając w głowie konkretne zdarzenia życiowe, które to uzasadniają. Bo jak ktoś mnie zapytał, co ja dzisiaj robię, czy mam konkretne zadania do wykonania, to jest to w dużej mierze taki networking, spotykanie ludzi, kojarzenie idei i zwracanie uwagi na to, co jest ważne. To zajmuje mnóstwo czasu, pracy i energii.
Na początku miałem fajne doświadczenia, bo w Holandii, Francji i Niemczech robiłem projekty informatyczne. Później przyjechałem do Polski, pracowałem w Oracle i robiłem duży projekt w Polsce – w Polskich Sieciach Elektroenergetycznych. Potem w ramach Oracle przeniosłem się z Warszawy do Minneapolis. Tam trafiłem na bardzo fajny projekt o wartości 12 mln dolarów, wdrożenie Oracle swift finansowej. Ja się kompletnie nie znałem ani na księgowości, ani na finansach; jak wchodzi księgowy, to staram się wychodzić innymi drzwiami, aby mnie nie zauważył. Ale oczywiście nie jest rolą osoby, która prowadzi projekt, aby wiedzieć wszystko. Po to się zatrudnia specjalistów, żeby to oni wiedzieli. Rolą kierownika jest to, żeby wypracowywać i wiedzieć, gdzie oczekiwać więcej, gdzie oczekiwać jakości, rozwiązań, gdzie nie być zadowolonym, a gdzie chwalić. Czyli taka ocena trochę bazująca na ogólnym doświadczeniu życiowym – dużo pracy z ludźmi. I tam ten projekt odniósł gigantyczny sukces. Oracle ma swoją metodę prowadzenia projektów – nazywa się ona Oracle Method – gdzie były etapy, różnego rodzaju produkty tych etapów. W Stanach Zjednoczonych jest inna kultura, może podobna do takiej, która jest w dużych krajach. Jeżeli ktoś odnosi nawet mikrosukces, to od razu ma wokół siebie grupę ludzi, którzy chcą na tym trochę skorzystać. Jak pojawia się lider i odnosi sukces, to wokół siebie gromadzi od razu grupę ludzi, którzy go supportują.
Miałem w Oracle projekt u klienta i musiałem zorganizować własną grupę, czyli był wewnętrzny nabór – ci ludzie czasami są, a czasami musisz ich pozyskać wewnątrz firmy, tak jakbyś miał niezależną firmę. My uprościliśmy tę oracle’ową metodologię, wyrzuciliśmy trochę produktów, bo ona była bardzo książkowa, miała ze 12 pozycji opisujących poszczególne etapy, np. analiza, projektowanie itd. Zaprezentowaliśmy to zarządowi tej firmy – jest to firma NCS; na giełdzie 2 mld dolarów obrotu, prezes mieszkał w Bostonie i przylatywał samolotem dwa razy w tygodniu. Oni podchodzili do tego zarządu z takim namaszczeniem, liderskością, taką nabożnością, niezwykłym szacunkiem. Atmosfera była dostosowana do spotkania: kto ma się kiedy odzywać, kiedy nie można nic powiedzieć. To był mój drugi mój projekt, duży, wdrożeniowy. Prezentowaliśmy wszystko na jednej kartce papieru. To było zrobione tak, żeby na jednej kartce papieru zarząd mógł zobaczyć całość projektu – na letter size, nie na A4, bo tam jest inny standard. I to była dla mnie ważna lekcja komunikowania się w informatyce, w której mamy dużo szczegółów. Jak rozmawiamy z adminami czy programistami, to w tej chwili w tym Lingo jest tyle skrótów od różnego rodzaju produktów, że tłumaczenie tego bardzo zamkniętego języka na język, którym posługują się prezesi czy decydenci, i wytłumaczenie im ważności pewnych kroków, ryzyk, musi być bardzo klarowne. Jak się nie da czegoś powiedzieć na jednym A4, to znaczy, że nie mamy tego dobrze przemyślanego. Wszystko da się sprowadzić do jednego A4. Oczywiście to nie znaczy, że nie możemy mieć pod spodem wielu setek stron dokumentów.
Twoja kariera jako kierownika projektu była szybka. Czy uważasz, że pomogły ci w tym studia psychologiczne?
Kompletnie nie. Czy wykorzystywałem w pracy zagadnienia psychologiczne? Nie. Zresztą skomplikowane są zagadnienia związane z funkcjonowaniem jako Polak – który zdobył doświadczenie w Holandii – w Minnesocie, która jest trochę jak Skandynawia w Europie. Tam mieszkają Norwedzy, Finowie, Szwedzi. Ich mentalność zdecydowanie różni się od Kalifornii czy Nowego Jorku. Postrzegano mnie tam jako osobę konfrontacyjną, bo lubię mówić, co myślę, lubię mówić krótko. W Minnesocie nigdy nie mówi się tego, co się myśli, na pewno nie na oficjalnych spotkaniach. Mówi się to, co trzeba, albo nie mówi się wcale, a po wyjściu ze spotkania za plecami innych mówi się, o co chodzi. Tak więc jest to bardzo niekonfrontacyjna mentalność. Nie odnajdowałem się tam. Natomiast podobało mi się to doświadczenie.
Później trafiłem na projekt, który miał ileś milionów dolarów, też oracle’owy, z czego mniej więcej 80% tego, co miało być dostarczone, Oracle w ogóle nie miał. Dostałem taką mapę funkcjonalną, były tam plamki pojedynczych punktów, w których coś było zrobione, a cała reszta to było obiecane, sprzedane i zapłacone nawet. Na szczęście firma popełniła błąd, bo oni mieli bardzo dużo takich centrów dystrybucyjnych jak Amazon. Nie wiedzieli, co z tym zrobić, bo e-commerce jeszcze za bardzo nie działał w 1998 r. Oni zrezygnowali z tego projektu, może słusznie, może niesłusznie, bo było na to za wcześnie. Projekt na 120 mln dolarów, nie było nawet wiadomo, jak go prowadzić, skoro Oracle nie miał rozwiązania. Mieliśmy te same iteracje tej samej struktury projektu nałożone na siebie, równolegle biegnące – w ogóle bardzo ryzykowny projekt.
Pytałeś się mnie wcześniej, czy czuję się biznesmenem, organizatorem, specjalistą czy inżynierem. Słowa „organizator”, „animator” tu bardziej pasują. Większość energii poświęcam komunikowaniu się z różnymi grupami i próbom prowadzenia ich w jednym kierunku, czy to wewnątrz spółki, czy to poza nią. Bardzo lubię i cenię pracę z inżynierami oraz podejście inżynierskie: „to się da zrobić”. Ostatnio interesuje mnie głębokie uczenie i nuclear fusion – fuzja nuklearna – czyli plazma i możliwości przeprowadzanie takiej reakcji, która dzieje się na słońcu i pozwala na generowanie gigantycznej ilości energii, miliony razy więcej, niż jest włożone. Okazuje się, że tu też można zastosować uczenie maszynowe i uczenie głębokie. Oczywiście tu próg wejścia jest bardzo wysoki, bo to są miliardowe projekty. A z drugiej strony, jak spojrzymy, ile w ogóle mamy wydać na energię, na elektrownie atomowe, jakie tam mamy ryzyka, to czuję taką inżynierską frajdę. Przynajmniej możemy spekulować, co by było potrzebne, ile by to kosztowało. Okazuje się, że energia pozyskana z fuzji nuklearnej wcale nie jest tak odległa. W tej chwili w Stanach są startupy, które przewidują, że w ciągu pięciu do dziesięciu lat będzie to możliwe. Bo ilość energii włożonej do uzyskanej nie jest już tak duża i są bardzo blisko tego break even. To oznacza bardzo tanio pozyskiwaną energię, bezpieczną, bez konsekwencji dla środowiska. Nie jestem fizykiem i całe te zagadnienia fizyczne są mi kompletnie obce, szczególnie jeśli chodzi o plazmę, natomiast uczenie maszynowe można wykorzystać do pewnych symulacji, parametryzacji i prowadzenia obliczeń związanych ze stabilizacją procesów fizycznych. Takie inżynierskie gadanie bardzo mi odpowiada, szanuję to i uważam, że jest to taka sama sztuka jak sztuka aktorska czy pisania poezji. Można docenić piękno czegoś takiego, skomplikowanie, pasję, jaką trzeba w to włożyć, serce, żeby powstało coś takiego. Ja nie widzę wielkiej różnicy pomiędzy fantastycznym wystąpieniem aktorskim a fantastycznym algorytmem, który ktoś napisał.
Trzeba przyzwyczaić się do takiej otwartości myślowej, nawet do teoretycznego dywagowania o tym, w jaki sposób pozyskiwać energię ze słońca. Myślę, że nie każdy jest psychicznie gotowy na tego rodzaju rozważania, w szczególności w kontekście czegoś, co sam miałby dotknąć, czy jakiegoś biznesu, który miałby prowadzić. Czy to jest coś, co zawsze miałeś, czy te doświadczenia zagraniczne jakoś ci w tym pomogły? To też wiąże się z Wirtualną Polską. Pracowałeś jako programista, kierownik projektów i nagle pojawiła się możliwość zrobienia czegoś takiego jak Wirtualna Polska, że musiałeś zrezygnować z innych działań i skoncentrować się na tym. Ciekawi mnie ta gotowość na to, żeby ruszyć w nieznane.
Jak mówił Steve Jobs: patrząc wstecz, można połączyć pewne punkty i zobaczyć trasę, natomiast praktycznie nigdy nie wiesz, jak ta droga będzie wyglądała. Jak pytasz mnie o to, skąd się to bierze, to pewne rzeczy wiem, pewnych nie wiem. Wiem, jak mieszka się w wielu krajach na świecie, czego wielu Polakom brakuje. W Polsce było takie podejście, że jak ktoś jest Francuzem, Anglikiem czy Holendrem, to w jakiś sposób już z natury jest kimś predystynowanym. Więc jak mieszkasz w tych krajach, jesteś z tymi ludźmi, masz z nimi kontakt, to zdajesz sobie sprawę z tego, że chłop holenderski nie różni się niczym od chłopa polskiego, ktoś, kto jest niemądry w Irlandii, jest równie niemądry gdzie indziej, wiele się nie różnią. Z kolei Finman powiedział, że nie należy mylić inteligencji z edukacją. Ktoś może mieć tytuł doktorski i być idiotą, czego pewnie doświadczyli ci, którzy obracają się w kręgu osób z tytułem doktorskim.
Polacy, którzy wyjeżdżają i robią fantastyczne kariery, mają osiągnięcia, pokazują, że ten świat jest w pewnym sensie taki sam, że ta natura ludzka jest bardzo zbliżona, że ludzie mają podobne problemy, podobnie się zachowują. Są pewne stereotypy typu „pojedź do Polski, twój samochód już tam jest” czy „uczciwy jak niemiecki diesel”. Sukcesy tych ludzi czy oszustwa wcale nie są inne niż te, których doświadczamy tutaj. Powiedziałbym wręcz, że tam bywają w większej skali, bo nikomu nie opłaca się być skorumpowanym za tysiąc dolarów, lepiej za kilka miliardów. Widzisz te napięcia polityczne, słuchasz mediów. Tam, gdzie są ludzie, problemy są zbliżone do siebie. I to jest część tej odpowiedzi.
Może jestem uparty. Jak mówi moja żona: „Zawsze wiesz lepiej” albo „Wydaje ci się, że wiesz lepiej”. Nie wiem, czy wiem lepiej, ale chcę wiedzieć. Popatrzmy na Teslę: wysyła SpaceX, robi samochody elektryczne. Czy było to nie do pomyślenia, nie do zrobienia? Było. Pierwsze samochody w ogóle były elektryczne, nie spalinowe. Oni powiedzieli: „Nie wiemy, czy nie da się tego zrobić, ale spróbujmy”. Podobają im się bardzo ambitne projekty, takie jak Fusion, ale też wygrana jest bardzo duża. Nawet jak nam się nie uda, to zamachnijmy się na słońce, może skończymy z ręką w chmurach, ale na pewno wiele się przy tym nauczymy. Cel jest chwalebny. Gdyby udało się taką energię produkować, to by było dobrze.
Na pewno jestem patriotą. Możemy to różnie definiować. Natomiast wydaje mi się, że mamy ten potencjał, powinniśmy produkować pomysły. Edukacja powinna zmierzać ku temu, żeby Polska była silnym krajem, który ma te rozwiązania, sprzedaje je innym, kupuje też, ale nie jest ani lepszy, ani gorszy od innych krajów i może te swoje szanse wykorzystywać. Informatyka jest takim obszarem. Sztuczna inteligencja i głębokie uczenie maszynowe to jest taka szansa cywilizacyjna, którą musimy wykorzystywać i w moim przekonaniu nie ma żadnych powodów, żeby nie zrobić tu gigantycznych postępów, które dałyby krajowi benefity.
Przechodząc do Wirtualnej Polski: czy na początku był to dla ciebie projekt hobbystyczny na zasadzie: zobaczmy, co się stanie, czy z góry było wiadomo, że tworzycie coś potencjalnie dużego i trzeba się spieszyć, żeby być przed innymi? Jakie były początki tego projektu?
Początki związane były z dyskusjami na temat tego, czy warto coś zrobić. Internet startuje, mam serwer i mogę publikować jakieś rzeczy. Wtedy nikt nie miał modelu biznesowego. W tej chwili widać, że taki Google uzyskuje 98% swoich przychodów ze sprzedaży reklam, a nie innych pomysłów czy algorytmów. Wtedy to nie było takie jasne, natomiast marzeniem było to, żeby w ogóle coś zrobić, zaistnieć. Łatwo było przewidzieć, jaki potencjał ma internet, że daje możliwość komunikowania się, wprowadzania różnego rodzaju usług, cyfryzacji, natomiast wiele czasu, dyskusji, spotkań, niepowodzeń zajęło mówienie o tym w 1994 r. My założyliśmy spółkę 1995 r., w on-line, byłem wtedy w drodze do Polski z Holandii. Kolegów znałem tylko wirtualnie, nawet z nimi nie rozmawiałem fizycznie. Przyjechałem z serwerem, który w tej chwili oddajemy do Muzeum Techniki, i mówię: „Chłopaki, ja mam inną pracę. Tu jest serwer, bierzcie go szybko. Ja nie mam czasu. Cześć!”. Później oczywiście założyliśmy spółkę. Mieliśmy przekonanie, że to jest coś, co należy robić szybko, ale oczywiście nie z taką wizją, co to dokładnie będzie i jaki będzie tego timing – to stały problem. Nigdy nie wiesz, w jakim momencie jest twoje rozwiązanie, jaka jest adopcja rynku. Myśleliśmy, że w dwutysięcznym roku to jest już szczyt. Widzieliśmy, że przed nami rozwój, ale wydawało nam się, że trzeba wymyślać ciągle nowe rzeczy, żeby być przed konkurencją. Wcale nie trzeba tego robić, trzeba po prostu mieć wizję, wiarę w nią i dobrze realizować pewne rzeczy.
Mieliśmy wtedy wiele serwisów w Wirtualnej e-commerce’owych, sklep WP, który miał dziesiątki tysięcy klientów, kilkanaście milionów obrotu. Mieliśmy taką platformę, jaką dzisiaj jest Allegro. Zresztą Allegro wtedy od nas kupowało ruch. I właśnie Allegro to przykład portalu, który miał wizję, realizował ją, trzymał się i nie poddawał. Oni wtedy płacili nam 100 tys. miesięcznie za przekazanie ruchu do nich, co w 1999 r. było gigantyczną kwotą. I oni podążali ścieżką dedykowaną rozwoju tej platformy. My natomiast chcieliśmy robić dużo rzeczy, m.in. można było robić wyszukiwanie. Wtedy rozwiązania do crawlingu, zasobów internetowych i indeksera, który to indeksował wszystko, były na słabym poziomie. Później pojawiły się AltaVista, Infoseek, które wyrzucały 500 milionów wyników, ale nic z nich nie wynikało, bo to była lista powtórzeń tego samego pliku. Później pojawił się Google. W międzyczasie był Fast, spółka norweska, która też świetnie sobie poradziła, ale przeszli w coś innego. Nikt wyszukiwaniem w Polsce poważnie się nie zajmował, dopiero później Netsprint, z którym jako Wirtualna blisko współpracowaliśmy. Pomogliśmy im się utrzymać i zaistnieć na rynku.
Wizją końcową Wirtualnej nie było to, że to będzie portal informacyjny, medialny, żyjący głównie z reklam. Natomiast intuicja podpowiadała, że to będzie w tę stronę szło. O tym rozmawialiśmy, ale wtedy nie było też narzędzi, nawet takich błahych do wyświetlania reklamy, np. banerów. Nie było standardów, możliwości obsługi 10 tys. użytkowników naraz, bo Linux sobie z tym nie radził, bo nie było baz danych. Trzeba było te rzeczy wymyślać i to należało do pracy inżynierskiej. Dzisiaj wiele rzeczy jest bardziej dojrzałych. Linux wtedy de facto powstawał. Wcześniej pracowałem na takich systemach jak Xenix, różnego rodzaju uniksowych odmianach. Brakowało takiego przeświadczenia całości tego, było natomiast przeświadczenie, że internet daje takie możliwości.
Przekonywaliśmy ludzi, że trzeba mieć stronę. „Po co mi strona, mam wizytówki”, „Po co mi adres mailowy”. Mówiliśmy, że wszyscy będą w internecie. I, oczywiście, jak przez trzy – cztery lata wszyscy ci mówią: „Internat to my już mamy tutaj, tutaj obok stoi budynek, to jest nasz internat, po co pan mi tutaj z internatem przyjeżdża”. „Internet, prze pana”. Można się oczywiście zmęczyć czymś takim, stracić tę wiarę, ale to jest właśnie komponent wiary w coś, nie masz gwarancji, że ci się uda, ale nie musisz codziennie wymyślać nowej usługi, czegoś ultranowoczesnego. Jest taka książka o tym, takim podziale np. na early adopters – ludzi, którzy wcześnie adoptują, później masz wielką dziurę i dopiero zanim ten rynek tradycyjnych użytkowników zaadoptuje twoje rozwiązanie, to możesz tego nie przeżyć. I dużo lat zajęło, zanim to się wykrystalizowało. Zresztą teraz widać, że Google ma wycenę trylion, a Yahoo – w zasadzie kilkaset milionów czy miliardów dolarów, ale okazało się, że te portale medialne nie stanowią aż takiej siły napędowej, że są inne mechanizmy, takie jak wyszukiwawcze, które okazały się bardziej istotne, zwłaszcza że konkurowanie kontentem i zawartością wyszło od wielu innych podmiotów, w tej chwili jest to streaming, Netflix. Widzieliśmy, że te usługi cyfrowe będą górowały – np. wszystkie niefizyczne, czyli bankowość, ubezpieczenia – będą wygrywały, natomiast człowiek nie miał wyczucia, kiedy dokładnie. E-commerce kulał, bo nie było wielu rozwiązań, np. takich podstawowych płatności jak teraz. Była świadomość, że jesteśmy na początku czegoś wielkiego. Nie było świadomości, jak to będzie się rozwijało w czasie.
Myślę, że w Polsce 2012 to był rok przełomowy – pojawienie się iPhone’a, smartfonów, telefonów, które stale były połączone z internetem. Moim zdaniem to był taki mocny przełom, kiedy wydatki na reklamy w internecie zaczęły rosnąć dramatycznie. Natomiast nie zbudowaliśmy kolejnej wyszukiwarki. Na pewno ten element sieciowy – social media. Czuliśmy, że kawiarenka Wirtualnej Polski, grupy, fora. Ale jak widać, dla niektórych ludzi to Facebook, Google są dzisiaj internetem i nie ma nic poza tym.
Można powiedzieć, że pechem w tym szczęściu bycia jednym z pierwszych z Wirtualną Polską było bycie jakby przed czasem, że ten świat internetu jeszcze nie był na to gotowy o tyle, że trudno było znaleźć prostą ścieżkę do zarabiania.
Tak, jak Yahoo mniej więcej wtedy wystartowało. My byliśmy na pewno bardzo wcześnie. Wydaje mi się, że wtedy wszyscy szukali jakieś recepty na sukces. A wystarczyło robić bardzo dobrze to, co się robi. Zresztą pokazuje to wiele serwisów, firm zajmujących się domenami. To były kiedyś bardzo małe firmy, a teraz urosły. Jak wyceniono Wirtualną na miliard, to wszyscy nas oskarżali o to, że to jest nieracjonalne, nieuczciwe wręcz, a w tej chwili Wirtualna na giełdzie ma 2,5 miliarda. Okazuje się, że ten miliard to było o 2,5 razy za mało, żeby wycenić cały potencjał. I trzeba było mieć wiarę i mówić odważnie, że za 10 lat będzie ten miliard. To jest uczciwa cena i absolutnie taki jest potencjał tego przedsięwzięcia. Nie jest to tyle, ile w tej chwili Allegro ma na giełdzie – ok. 70 mld. Ale ile to lat – 20! Czyli przez 20 lat trzeba było to udowadniać wszystkim ludziom, którzy mówili: „Fajne, ale ja muszę robić zupełnie coś innego, bo to są te bieżące moje fizyczne problemy, które rozumiem”. Świat czy ludzie wcale nie wspierają tych, którzy robią coś nowego. Oni podążają w swoim tempie i trzeba mieć dużo siły, wiary, mentalnej energii do tego, żeby powiedzieć: Nie! My jesteśmy na dobrym tropie, walczymy i powoli w którymś momencie zaczyna czuć się ten sukces. Akurat w przypadku internetu był taki wybuch, w dwutysięcznym roku wszyscy o tym mówili. Później ta bańka pękła, dużo firm zbankrutowało. I tych iteracji mamy tam wiele, ale w tej chwili mamy już taką dojrzałą iterację. Ale to zajęło 20 lat, to i tak jest bardzo szybko.
Wirtualną Polskę sprzedaliście. Nie wdając się w szczegóły tych różnych zawirowań wokół niej, czy w tej chwili żałujesz, że wyszliście z tego projektu, czy tego nie żałujesz, czy to było wtedy niemożliwe?
Nie. Jeżeli pytasz mnie o to, czy chciałbym być nadal właścicielem Wirtualnej Polski, to tak. To dobre przedsięwzięcie, które generowało wiele bardzo fajnych pomysłów. Wielu ludzi wyszło z Wirtualnej i robiło inne przedsięwzięcia. Natomiast czy to było możliwe? Raczej nie.
W takim razie, czego nauczyło cię to doświadczenie z Wirtualną Polską? Czy tych bardzo wielu, różnych inicjatyw, które przy okazji można było realizować, otwartości na nowe pomysły czy też właśnie obracania się w świecie tego wielkiego biznesu? Czy jeszcze czegoś innego?
Czego mnie nauczyło? Gdyby podsumować to taką jedną myślą przewodnią: nie wierz w opcje. Oczywiście bardzo wiele się nauczyłem. Natomiast mam wrażenie, że później nauczyłem się jeszcze więcej. Że sukces niekoniecznie, porażki uczą bardziej, a przynajmniej bardziej się je pamięta. Raz się na czymś sparzysz, to następnym razem podchodzisz do tego dużo lepiej. Sukces w pewnym sensie usypia. Wydaje ci się, że powtórzenie go jest możliwe, bo skoro raz się udało, to drugi raz też się uda. A później przyszedł kryzys 2008 r. i okazało się, że wiele rzeczy zupełnie straciło wartość. Na pewno dużo się nauczyłem i być może zyskałem dzięki temu taką bazę do innych doświadczeń, natomiast mogę powiedzieć, że wiele nauczyłem się też później.
W takim razie powiedz, co było później, bo ten duży projekt zakończył się sprzedażą. Więc co było dalej po takim kamieniu milowym? Czy postanowiłeś odpocząć, przejść na emeryturę czy wejść w nowe projekty? Jaki to był czas dla ciebie? Poszukiwania nowych rzeczy?
Nikomu nie radziłbym przechodzenia na emeryturę. Jest taki problem, że ktoś jedzie rozpędzoną maszyną, raptem wysiada i nie wie, w którą stronę ma iść. Wirtualna wtedy była zawodowo całym moim życiem, więc z tego punktu widzenia zdefiniowanie jeszcze raz swojej aktywności jest trudne. Masz pieniądze, zastanawiasz się, co teraz z nimi zrobić, jak zainwestować, jak spędzać produktywnie czas. Niewątpliwie dobrze jest się angażować w coś zawodowo. Znalezienie takiego zajęcia, pomysłu, nowej aktywności jest trudne. Ludziom, którzy odnieśli jakiś sukces, zalecałbym, żeby bardzo ostrożnie wybierali nowe zajęcie i nie jechali tylko na poczuciu sukcesu, że skoro udało się, to uda się jeszcze raz. Pewnie się uda, ale być może będą trzy – cztery porażki po drodze. Nie zrażać się. Wiedzieć, że to wszystko zajmuje dużo czasu. Na pewno radziłbym, że jeżeli macie inwestować pieniądze, to inwestujcie realnie swoje. Jeżeli macie sukces, doświadczenie, to jest to wasz kapitał. Róbcie nowe przedsięwzięcia z pieniędzy, które przekażą wam inni. Wy jesteście od tego, żeby realizować pewne pomysły. Nie ryzykujcie tym, co raz już zdobyliście. A jeżeli ryzykujecie, to róbcie to w bardzo ograniczonym stopniu. I szukajcie tego nowego miejsca dla swego zaangażowania.
Czyli poszukiwania nowych projektów trwało jakiś czas.
Zaangażowałem się dużo w rodzinę, w wychowanie dzieci, co jest oczywiście ważne, natomiast powinno być też zbalansowane. Nie jest dobrze, jak raptem ojciec skupia się na tym, co robią dzieci, w zbyt dużym stopniu. Były takie inwestycje trochę ad hoc, z dystansu, bardziej finansowe niż angażujące się w meritum tego, co ludzie robią. A później przyszedł ten kryzys 2008 r., który trochę przedefiniował finansowo wiele rzeczy. Następnie w ramach szukania czegoś nowego pojawił się VoiceLab. I oni przekonali mnie teoretycznie tym, że to, co oni mówią o algorytmie rozpoznawania mowy, ma sens. To faktycznie mogłoby tak działać. Oczywiście rozpoznawanie mowy, tak jak większość technologii, ma wieloletnią tradycję – zajmowano się tym już 50 lat temu. Zaangażowałem się w to. Nadal było bardzo ciężko.
Rynek nie był na to gotowy, ponieważ rozpoznawanie mowy ma taką wadę, że zawsze masz do czynienia głównie z błędem, poziomem tego błędu. To nie jest tak jak np. z krzesłem – jednemu się podoba, drugiemu nie, ale krzesło samo w sobie nie ma wady. Ma wszystko, co powinno mieć, ma wszystkie komponenty, możesz je wykonać lepiej, wypolerować, cokolwiek, i ono jest fizycznie gotowe. W przypadku rozpoznawania mowy pierwszą rzeczą, z jaką masz do czynienia w kontakcie z użyciem, to: „To nie tak, ja tego nie powiedziałem”. W związku z czym masz ciągle taki negatywny feedback, który opiera się rzeczywiście o niedojrzałość nie tyle tej technologii, co w ogóle komunikacji jako takiej. Ludzie nie zdają sobie sprawy, jak dużo błędów tolerują. Między tym, co ja mam w głowie, a tym, co ja powiem, a tym dźwiękiem, który do ciebie dotrze, a tym, co ty zrozumiesz z tego, jest cała masa różnego rodzaju błędów, przeinaczeń. Ludzie czasami mówią coś innego, niż chcieli powiedzieć. Przejęzyczenia zdarzają się niektórym osobom. Po prostu człowiek funkcjonuje w takiej sferze, w której toleruje wszelkie błędy poznawcze, niezrozumienie, jest do tego przyzwyczajony, czuje się w tym dobrze i to niczego nie zmienia w komunikacji.
W trakcie rozmowy tylko część informacji jest akustyczna, a część w ogóle wynika z mimiki. Jak czytamy zapis spontanicznej mowy, to ona w zasadzie nie ma sensu. Myślimy: Ludzie tak nie mówią. Ale jak dodamy do tego dźwięk, to okazuje się, że ludzie tak oczywiście mówią. Po pierwsze – rynek nie był gotowy, po drugie – nie było zapotrzebowania na usługi, na rozpoznawanie mowy. Wszyscy dopiero zapoznawali się z tą tematyką. Było takie przekonanie, że to nie działa: „Przecież ja miałem z tym kontakt dwa lata temu i to w ogóle nie działało”, albo z drugiej strony oczekiwanie od klienta: „Wie pan, jeżeli to nie rozpoznaje 100% dokładnie, to nie jest to dojrzała technologia”. Nie ma czegoś takiego jak 100%. Jedyną pewną rzeczą jest zmiana. Było zatem dużo frustracji wynikającej z tego, że pracując nad czystą technologią rozpoznawania mowy, nie mając do niej aplikacji, niewiele firm interesowało się samym rozpoznawaniem mowy, zwłaszcza ułomnym.
My zawsze zajmowaliśmy się uczeniem maszynowym jako takim, a głębokie sieci weszły w 2014 r., kiedy my zaczęliśmy coś z tym robić. Na szczęście już dużo wcześniej zajęliśmy się kartami, akceleratorami typu karty Nvidia GPU. I to głębokie uczenie pokazało, że wiele obszarów, które były wcześniej nieosiągalne, raptem okazały się na tyle lepsze jakościowo, że przekroczyły tę magiczną granicę użyteczności. Jeżeli miałem wcześniej rozpoznawanie mowy na poziomie skuteczności 60%, a raptem mogłem mieć 80%, to te 20% różnicy stanowi gigantyczną przepaść. Raptem wszystko zaczęło się bardzo szybko rozwijać.
Wydaje mi się, że w porównaniu z 1997 r. uczenie maszynowe, a w szczególności głębokie uczenie, stanowi obecnie szansę cywilizacyjną dla Polski. Oczywiście nie mówimy tak, jak myśli większość polityków czy ludzi, którzy nie mają dość informacji, np. „O, ma pan chmurę, chcę z chmury skorzystać”. Jeden serwer ośmiokartowy z kartami GPU V100 na Amazonie kosztuje 82 tys. dolarów miesięcznie, więc nie stać na to żadnego startupu. Wobec tego chmura do obliczeń, do treningów, do uczenia maszynowego – nie. Do postawienia sobie strony – być może. Ale mówimy tu konkretnie o głębokim uczeniu. Wielu ludzi, którzy mieli wcześniej do czynienia z uczeniem maszynowym i uczeniem neuron networks, też przeżywało rozczarowanie, że „no, my znamy sieci, zajmujemy się tym, ale…”. Ja mówię: „Ale te głębokie są zupełnie inne, zupełnie inne efekty się uzyskuje”. „No tak. A nie można z tych głębokich zrobić płytkich? Wtedy byłoby bardziej elegancko, byłoby ciekawiej”. Więc te głębokie sieci i poczucie postępu, że to się rozwija, że można więcej i dokładniej, to był przełom. I od 2016 r. powinniśmy w Polsce w to inwestować.
Mamy te komputery nie tylko w chmurze i na pewno z akceleratorami – i setki, tysiące tych akceleratorów w jakimś regionie. Mamy dane uczące, czyli nie to, że ktoś powie: „Nie, my mamy dzisiaj w Polsce taki program ‘otwarte dane’ – ‘open data’ – i proszę bardzo, można z tego skorzystać”. Nie o takie dane chodzi, jeszcze jesteśmy na etapie uczenia nadzorowanego i tu chodzi zawsze o dane w jakiś sposób oznaczone, takie, które wymagają ingerencji ludzkiej. Czyli mamy 10 tys. godzin nagrań z dokładną transkrypcją. Mamy 50 mln obrazków z identyfikacją obiektów. Mamy zatem dużo surowych danych, które człowiek musi przerobić. I to jest do zrobienia, jest cloudsourcing, więc róbmy to. To jest dla wielu rozwiązań de facto próg bardzo wysoki i trochę trudniejszy. A w tej chwili trzeci próg to są ludzie wykształceni, z umiejętnościami. Tutaj też mamy dobre zasoby. To też jesteśmy w stanie robić. Mamy zespoły i osobowości, które są w stanie kierować takimi przedsięwzięciami.
To nie jest tak, jak mówiłem wcześniej o tej energii jądrowej. Największy próg naukowy w tej chwili to ten Fusion we Francji, ośrodek wart 10 mld euro; pewnie to będzie tak samo jak z Space-X i z Teslą. NASA wydawało gigantyczne ilości pieniędzy, a okazało się, że można było 50 razy taniej wysłać rakietę w kosmos. Można było również kupić kable w Walmarcie i włożyć je do jakiegoś prototypu. Infrastruktura, jaka jest potrzebna do tych eksperymentów, jest dużo, dużo większa niż tutaj. Tutaj jak studenci, którzy są na drugim roku informatyki, jak robią jakieś rozpoznawanie, biorą otwarty data set, robią algorytm typu rozpoznawanie kotków z obrazków. I to jest fenomenalne, że można, że to działa, natomiast wydaje mi się, że mówienie o tym w wielu miejscach, w wielu mediach, do wielu decyzyjnych osób, jeżeli mamy mieć jakąś strategię informatyczną kraju czy strategię cyfryzacji, o jakiej mówi się ostatnio, czy też strategię AI, to mówienie o tym, że te trzy komponenty są potrzebne. I jeżeli dzisiaj w Polsce nie ma żadnego ośrodka, który ma moc obliczeniową, taką jak 128 kart, jaką w eksperymentach robi Google, Facebook w zasadzie codziennie, to znaczy, że nie mamy narzędzi do tego, żeby nawet zreplikować state of the art na dzisiaj. Czyli jak ktoś mówi: „My mamy fajne osiągnięcia”. Mówię: „Dobra, a te eksperymenty, które robiliście, OpenEye zrobił GPD 3 na iluś tam setkach kart. Jeżeli wy nie macie do czynienia z dwoma kartami GPU, to jest niepoważne”. Mówimy tu o fizyce, chemii, biologii, medycynie – w zasadzie o wszystkim. Najprościej byłoby wyposażyć ośrodki badawcze w Polsce w masę serwerów z kartami akceleratorami, które umożliwiałyby uczenie głębokie. I to jest najprostszy sposób, kupić serwery nie jest tak trudno.
Wspomniałem, że realizujesz projekt o nazwie Digital Innovation Hub, który finansowany jest przez Ministerstwo Rozwoju. Czy ten projekt i tego rodzaju projekty uważasz za krok w kierunku wspomagania tej krajowej działaności?
Tak. W dużej mierze to moje zaangażowanie się w DIH było pro publico bono. Dużo jeździłem, mówiłem, przekonywałem, prezentowałem. Były dziesiątki power pointów, które mówiły: „To jest szansa…” – tak jak z tym internetem 20 lat temu – „…trzeba to realizować”. Nie możemy korzystać z internetu niemieckiego, bo oni już go zrobili i go mają. Tak jak z lotniskiem w Berlinie – nie budujmy własnego, bo już jest w Berlinie. I nie budujmy własnego internetu, bo niemiecki jest równie dobry, a nawet proszki do prania są dużo lepsze. Nie – musimy budować własne. To zaangażowanie w DIH było szansą na to, żeby zrobić coś praktycznego w tej domenie. I oczywiście jako VoiceLab nie mamy na to środków, mamy jakiś team, ludzi, którzy chodzą, mówią o cyfryzacji, przekonują, prezentują. Ten DIH właśnie służy do tego, żeby taką działalność zrobić.
W tej chwili startujemy we wniosku o EDIH – są to europejskie DIH-y; próbujemy dołączyć do europejskich DIH-ów, które mają dłuższą historię, i dogonić te istniejące struktury, co, mam nadzieję, nam się uda. Musimy więcej budować. Są struktury istniejące ileś lat, które mają swoje zespoły, marketing, networking, więc im te środki z EDIH-u bardziej pomogą. My musimy w pewnym sensie jeszcze budować. Możemy coś zademonstrować, bo mamy w tej chwili centrum robotyczne – prototypownie, fizyczne miejsce, do którego ludzie mogą przyjść. Mamy tam projektowanie, możemy coś zespawać, zbudować, zbudować robota, pokazać, jak on działa autonomicznie, zastosować rozpoznawanie mowy. Jako VoiceLab nie robiliśmy takich inicjatyw, bo nie mamy takiej możliwości. DIH takie rzeczy umożliwia. Próbujemy tu też integrować to środowisko, mówić, że pomorskie jest takim ośrodkiem, które jako sztuczna inteligencja ściąga. Mamy tu Amazon, Intel, Momentum, które trzeba wykorzystać. Moją rolą jest głównie networkingowanie i mówienie o tym, co jest ważne i jakie są główne kierunki rozwoju. Mam nadzieję, że uda nam się pozyskać ten nowy grant i to kontynuować.
Mamy taki DIH for AI, bo na poziomie europejskim są tam obszary, które wymagają specjalnej uwagi. Bardzo szeroko cyfryzacja, ale ze specjalnym naciskiem na internet of things, 5G, sztuczną inteligencja. Uważamy, że w tej sztucznej inteligencji jesteśmy mocni, mamy konkretne rozwiązania, z konkretnych spółek, takich jak VoiceLab i partnerów. Próbujemy zrobić takie gremium, bo mamy jakościowo fajne rozwiązania. Potrzebujecie specjalisty od jakiegoś rozwiązania, wiedzy eksperckiej o NLP, o obrazowaniu, to możemy przynosić to do przedsiębiorców, którzy muszą się edukować. AI będzie zmieniało gospodarkę i zatrudnienie. Raptem okaże się, że w rolnictwie świetnie radzą sobie maszyny i jeżeli tylko nadążymy za produkcją tego rodzaju rozwiązań, nie będąc skazanymi tylko na kupowanie ich z zewnątrz oraz rozwiniemy to sami, to może się okazać, że ten brak rąk do pracy w rolnictwie można nadrobić robotyką. Można lepiej nadzorować plony. Wspomożemy pracę radiologów świetną i szybką diagnostyką obrazowania. Te rzeczy w DIH-u będą realizowane. Stąd moje zaangażowanie w to, żeby część mojego gadania przy okazji takich spotkań jak z tobą miała większą moc sprawczą i żebym nie miał przekonania, że po raz kolejny jadę do Warszawy na spotkanie, w którym uczestniczy dużo ludzi i nic z tego nie będzie.
To bardzo fajna wizja rozwoju naszego polskiego rynku i polskich możliwości w zakresie sztucznej inteligencji. Jak najbardziej się pod tym podpisuję, to jest super istotne i fajnie, że są takie inicjatywy.
Jacek, bardzo dziękuję ci za tę rozmowę. Dzięki wielkie i powodzenia w dalszych działaniach.
Dziękuję za szansę porozmawiania z tobą.
Myślę, że to fajna ścieżka w IT i w biznesie, która może być inspirująca dla wielu ludzi. Dzięki jeszcze raz i do usłyszenia przy kolejnej okazji.
Komentarze