#19

Hubert Kobierzewski - Czym jest Business Intelligence

W tym odcinku Łukasz Kobyliński rozmawia z Hubertem Kobierzewskim na temat Business Intelligence. Rozmawiamy o przebiegu wdrożenia BI w firmie, jego korzyściach oraz relacji w odniesieniu do analizy danych i Big Data.

Streszczenie odcinka

  1. Jak rozpoczęła się Twoja przygoda z Business Intelligence
  2. Czym właściwie jest Business Intelligence?
  3. Jaki jest zakres pojęcia BI i jak to się ma do analizy danych?
  4. Jak w praktyce wygląda praca specjalisty od Business Intelligence?
  5. Jakie problemy mogą pojawić się przy wdrożeniach BI w firmach?
  6. Jak dokładnie należy poznać firmę, to czym się zajmuje, żeby móc dokonać takiego wdrożenia?
  7. Jakie są korzyści Business Intelligence w firmie?
  8. Jak głęboko BI ingeruje w firmę?
  9. Czy zarządzanie w oparciu o dane może prowadzić do pewnego rodzaju wypaczeń?
  10. Przykłady informacji, które są ciekawe dla firmy, a można je uzyskać dzięki procesom BI.
  11. Jak w praktyce wygląda wdrożenie Business Intelligence?
  12. Czym są kostki analityczne?
  13. Jaka jest relacja między BI a Big Data?
  14. Czy w Twoim odczuciu analiza danych jest aktualnie trendem?
  15. Jak zazwyczaj wygląda ścieżka kariery osoby, która zaczyna zajmować się Business Intelligence?
  16. Jakie są najlepsze sposoby na rozwijanie się w tym kierunku?

Transkrypcja odcinka

Cześć, z tej strony Łukasz Kobyliński. Witam Was w kolejnym odcinku podcastu „Stacja IT”. Dzisiaj porozmawiamy na temat analizy danych, wizualizacji i szeroko rozumianego business intelligence. Moim dzisiejszym gościem jest Hubert Kobierzewski.


Cześć, Hubert!

Cześć, nazywam się Hubert Kobierzewski i mam zaszczyt porozmawiać dzisiaj głównie o business intelligence.

Czy możesz powiedzieć parę słów o sobie, o tym, czym zajmujesz się na co dzień.

Pracuję w firmie Codec, zajmuję się tam działką business intelligence. Czasem jeszcze poprowadzę jakieś szkolenie, czasami wieczorami zajmuję się społecznością, która nazywa się „Data Community” – obecnie jestem jej prezesem. To taka prężna organizacja, która już od ponad 10 lat działa w wielu miastach Polski. Spotykamy się też na ogólnopolskich wydarzeniach, co ma związek zwykle z platformą danych Microsoft, ostatnio np. z artificial intelligence.

Kiedy następne spotkanie?

3 stycznia 2019 r. w Warszawie w siedzibie Microsoftu o godzinie 18. Dodatkowo zajmuję się grupą Power BI, która spotyka się zwykle w trzeci czwartek miesiąca w Startberry na Grochowskiej.

Czy tym tematem zajmujesz się od początku kariery IT, czy robiłeś coś innego, nim zacząłeś zajmować się business intelligence?

Gdy byłem młody, chciałem zajmować się programowaniem, tym, żeby to ładnie wyglądało, zachwycało, a niekoniecznie działało dobrze. Więc przez wiele, wiele lat byłem programistą. Zaczynałem w Delphi od pierwszej wersji, w której językiem programowania był Pascal. Później nastąpił pewien zwrot w kierunku visual basic, potem znowu Delphi. A gdy weszły technologie dotnetowe, microsoftowe – to było jeszcze ok. 12 lat temu – siedziałem przed biurkiem i pisałem oprogramowanie.

Później przyszła refleksja, że czas się zająć czymś innym. Czy to był nowy temat, który wydawał się bardziej atrakcyjny?

To był czas, gdy siedziało się więcej w bazach danych i poznawało je. Gdy przyszła firma Codec, stwierdziła, że będę w tym dobry, a ja jeszcze wtedy nie wiedziałem, co to jest kostka analityczna. Pokazano mi świat danych z trochę innej, szerszej perspektywy, nie tylko takiej, w której wypełnia się wymagania funkcjonalne jakiegoś oprogramowania transakcyjnego.

Co to jest business intelligence?

Najogólniej można to zdefiniować w ten sposób, że to jest wyciąganie informacji z danych. To takie źródło wiedzy. Bo zwykle jest tak, że jeżeli zaczynamy mieć do czynienia z danymi, to są to dane, które zapisujemy jako programiści w bazach danych. One się tam gromadziły i służyły do tego, aby rozpocząć jakiś proces i zakończyć, np. sprzedaż samochodu. Ale potem przychodzi zarząd sprzedawcy samochodów i pyta, czy zarabia, czy traci. To jest ta wiedza, którą później uzyskuje się z tych danych. Bardzo często jest tak, że ta wiedza jest ukryta w różnych miejscach. Oddzielnie mamy system do obsługi przedsprzedażowej, te CRM-y, marketing, który korzysta z dobrodziejstw social mediów, cały wewnętrzny system sprzedażowy, potem posprzedażowy. To są źródła pojedynczych silosów danych, a potem przychodzi business intelligence, łapie to wszystko i wrzuca do jednego wora we w miarę ustrukturyzowany sposób. Zwykle przychodzimy tu z takim pojęciem „hurtowni danych”, potem wstawiamy business intelligence, który jest tak naprawdę wisienką na torcie, stercie danych, którą zebraliśmy.

Jaki jest zakres business intelligence? Czy jest to analiza danych zorientowana na biznes związana z wyciąganiem wiedzy istotnej biznesowo?

Tak, jest to analiza wiedzy ze zgromadzonych danych, które potem pomagają prowadzić biznes. Jeżeli dowiemy się, że źle nam idzie, to trzeba szukać tego, gdzie idzie nam źle. Czasem jest to zrobione przez uczenie maszynowe, bo uczenie maszynowe pokaże, w których miejscach robimy coś źle, a czasem trzeba to ręcznie zrobić – w zależności od tego, w co tak naprawdę zainwestowaliśmy od strony tego business intelligence.

Jak w praktyce wygląda praca specjalisty od business intelligence?

Są dwa tory, którymi można iść. Jeden to taki business intelligence developer, czyli specjalista techniczny, który bierze klawiaturę, myszkę, oprogramowanie np. do budowy hurtowni danych i buduje to wszystko technicznie. Ta osoba musi mieć też pojęcie, czym są wymiary, miary czy atrybuty. Drugi tor to analityk biznesowy, który stoi twarzą do klienta. To, co kieruje jego pracą, to przede wszystkim potrzeby klienta. Firma czuje, że potrzebuje business intelligence albo że ma to business intelligence, albo jeszcze nie wie, że ma, ale zaczęła mieć – my jesteśmy po to, aby to wskazać albo by najpierw klient się wyspowiadał, co go boli i jakich informacji oczekuje. I my sprawdzamy, czy te dane są u nich, czy ich nie ma, czy da się to połączyć, ile pracy trzeba w to włożyć i w jakich etapach my to zrobimy. Ustalenia takiego projektu business intelligence przekazuje się BI developerom, którzy potem to implementują, oczywiście przy interakcji z klientem, sprawdzeniu, czy to idzie dobrze, czy źle.

Dla tych, którzy wolą działać bardziej technicznie – BI developer, a dla tych, którzy są bardziej otwarci na stanięcie twarzą w twarz z dobrym albo złym klientem – to taki trochę analityk biznesowy.

Z jakimi typowymi problemami trzeba się zmierzyć przy wdrożeniach, ustawieniach business intelligence w firmach?

Najbardziej powszechnym zjawiskiem jest tzw. exceloza, czyli w firmie mamy tysiąc exceli, nad którymi już nie panujemy, nie wiemy, która wersja jest dobra, która jest OK. Może ktoś napisał jeszcze jakiś kod i jego sens biznesowy został zapamiętany albo napisał „+30 tys.” w jednej komórce i ona jest powielana w innych wersjach, gdzie to już biznesowo nie ma sensu. Firmy czasem nie wiedzą, że mają business intelligence, bo dla nich to faktycznie zaczyna się, gdy ktoś zbierze kilka ekstraktów w jeden Excel i użyje funkcji „wyszukaj pionowo”. Tak naprawdę to jest dla nich pierwsza wersja business intelligence. Kiedy my przychodzimy, choroba zwykle już postępuje, bo ciężko się odzwyczaić od tych exceli, zwłaszcza działy controllingu wiodą w tym prym. Trzeba te całe rozwiązania, które tam są, poddać pewnej kontroli, ułożyć, pojęciowo się dogadać, ponieważ różne działy w firmie raportują i stosują odmienne pojęcia. Często jest tak, że jak wprowadzimy hurtownię danych business intelligence, zaczynamy automatycznie produkować raporty, to przychodzą kierownicy działów i mówią, że chcieliby, aby one były jednak inaczej przedstawione, bo okazuje się, że niekoniecznie w dobrym świetle ich pokazują. My oddajemy władzę bardziej danym aniżeli ludziom nad danymi. Wolimy, aby te decyzje były oparte na danych, a nie pewnych sugestiach, które każdy może stworzyć na swoim komputerze.

Jak głęboko trzeba wniknąć w biznes, aby zrozumieć, czym dana firma się tak naprawdę zajmuje? Bo jeśli mówimy o excelach, w których zapisuje się różne rzeczy, to mogą tam być bardzo specyficzne dla biznesu dane, kolumny, rozumienie tych danych. Ile czasu trzeba poświęcić, aby zorientować się, co jest dla tej firmy istotne i co ona robi?

Tu rzeczywiście potrzebny jest pewien aspekt wiedzy dziedzinowej. Ale my w Codecu dzielimy business intelligence na dwie twarze. Jeden to controlling finansowy, który w zasadzie w większości firm wygląda tak samo. Czyli układ kont, układy zarządcze, sprawozdawcze, konsolidacja finansowa – takie rzeczy są zwykle regulowane regułami albo prawem. Wszystkie firmy podlegają tym samym regułom. Druga sprawa to business intelligence operacyjny. Tu już trzeba wejść w klienta. Zwykle wyłania się taką osobę, którą określa się mianem subject-matter expert. Ta osoba jest dla nas interfejsem, którą bierzemy w momencie, gdy rozpoznajemy, co w danej firmie się dzieje, i ona nam tłumaczy, co czym jest, jakie są procesy biznesowe, jakie informacje chcemy wyciągnąć z danych generowanych przez te procesy biznesowe. Współpraca z klientem musi być bardzo ścisła. Oczywiście jeśli robiliśmy jakiś projekt w tej samej branży, to dużo łatwiej jest wchodzić, ale z doświadczenia wiem, że przy takim układzie, kiedy pobieramy kogoś do zespołu od klienta – jedną albo więcej osób – to tę współpracę jak najbardziej da się ułożyć, nawet bez znajomości branży.

Jakie są korzyści tego procesu? Czy zarząd lub inne osoby, które pracują w firmie, mogą otrzymać jakieś istotne informacje?

Przede wszystkim to jest właśnie zarząd, działy kontrolingu albo kierownicy poszczególnych działów, bo to oni zwykle podejmują decyzje, oni potrzebują danych do ich podjęcia. To są pierwsze osoby korzystające z tego procesu. Zwykle jest tak, że one mają problem z czasem. Gdy jest zamknięcie miesiąca, to do trzeciego dnia następnego miesiąca zaczyna się popłoch. Proszę sobie wyobrazić początek maja, kiedy w Polsce te pierwsze trzy dni są wyjęte, a jeżeli jesteśmy firmą w grupie, mamy regulacje wewnętrzne, to ludzie siedzą po godzinach. To, co my robimy, to oddajemy ludziom czas, żeby mieli go więcej dla siebie. Bo te procesy hurtowego zasilania raportów danymi są zautomatyzowane do takiej postaci, żeby generowanie raportów było dużo łatwiejsze, aby nie trzeba było spędzać nad tym już tyle czasu co wcześniej. Nasi klienci dosłownie mówią nam, że oddajemy im wieczory i pole do popisu, aby robić u siebie w pracy więcej.

Myślę, że jak taki business intelligence działa dobrze na poziomie kierowników czy zarządu, to następnym krokiem jest taki business intelligence operacyjny, gdzie daje się takie dashboardy czy kokpity menedżerskie pracownikom pierwszej linii. Załóżmy, że jesteśmy pracownikiem call center, dzwonimy do klienta i mamy przed sobą dashboard klienta, wiemy, w których miejscach i jak jest on zaangażowany, czy często do nas dzwoni, czy nie, jakie sprawy zgłaszał wcześniej. Taki człowiek już na pierwszej linii jest w stanie podejmować decyzje. Business intelligence przede wszystkim pomaga nam podejmować decyzje w locie. Oczywiście jest jeszcze aspekt eksploracji danych – dzięki niemu osoby, które mocno siedzą z danymi, wyciągają jeszcze informacje z głębi, np. w który segment produktów wejść głębiej albo którego się pozbyć, bo jest nieopłacalny.

Jak głęboko ingeruje w firmie takie wdrożenie business intelligence? Bo pewnie można w miarę bezboleśnie zebrać różne źródła danych, aby poddać je wspólnej analizie, ale jeśli firma nie rejestruje czegoś, co jest istotne, z jakiegoś powodu nie zapisuje istotnego faktu o klientach albo transakcjach, to trzeba wprowadzić element tego typu procesu. Czy pojawiają się jakieś problemy wynikające z tego, że wpływamy na wewnętrzne procesy firmy?

Zwykle w większych firmach – już tak. To, co często proponujemy w większych organizacjach, to stworzenie sobie takiej komórki. My to nazywamy BI center of excellence, gdzie dobiera się co najmniej trzy osoby, które potem będą sterowały zmianami w firmie, bo bardzo często jest tak, że pojawienie się business intelligence, hurtowni danych czy w ogóle analizy danych powoduje, że zaczynamy na te dane patrzeć troszkę inaczej, właśnie ze względu na wykorzystanie wiedzy, która w nich jest. Ale często okazuje się, że te osoby, które wprowadzają dane, ze względu na swobodę pozostawioną przez twórców aplikacji wpisują, kolokwialnie mówiąc, bzdury. A potem z tych bzdur wychodzą nam fajne rzeczy w raportach. Procesy jakości danych, master data management czy chociażby zalążki takich projektów to jest taka najsilniejsza zmiana w firmie. Często bardzo ciężko ją wprowadzić, bo należy do tego przekonać najwyższe władze w firmie, do tego, że trzeba będzie wydać trochę pieniędzy, żeby ułożyć procesy biznesowe, które nie dadzą efektów w pięć dni czy w trzy miesiące, bo to są raczej programy na pół roku czy kilka lat. Taki center of excellence, który będzie zainteresowany nowymi systemami czy modyfikacją systemów transakcyjnych działających w firmie i będzie zawsze miał BI z tyłu głowy, zacznie się przyglądać wszystkim wymaganiom stawianym aplikacjom nie tylko pod kątem wypełniania tych transakcyjnych procesów biznesowych, ale też właśnie analityki. I właśnie oni powiedzą, że OK, w procesie biznesowym data urodzenia może jest nieważna, ale np. w procesie analitycznym – już tak. I to jest pierwszy krok do tego, aby zapewnić sobie dobre raportowanie, dobrą jakość. Poprzez takie inicjatywy, typu master data management, zarządzanie danymi albo data quality budzi się też właścicielstwo danych, odpowiedzialność, to, do czego ludzie bardzo często nie chcą się przyznawać.

I pewnie taka jednostka w firmie pełni jakąś rolę w tych aspektach miękkich, w przekonywaniu ludzi, że warto, że trzeba, że to dla naszej korzyści, bo spodziewam się, że opór może być duży.

My nazywamy to „ewangelizacją”. Rzeczywiście tam co najmniej jedna osoba musi być tą, która będzie popularyzowała to business intelligence. Bo jeżeli wprowadzamy jakiekolwiek projekty w firmie, to jeżeli ich adaptacja jest słaba, użyteczność na pierwszej linii jest niefajna, to takie systemy umierają w firmie. To, co nie jest wykorzystywane, jest wyrzucane. Muszą więc być osoby, które będą propagowały wiedzę o tym, że w ogóle coś takiego jest, tłumaczyły, jak tego używać, jakie korzyści z tego uzyskamy itd. Mimo wszystko niektórzy ludzie będą chcieli pozostać przy starych excelach i pracować takim sposobem dalej, bo to jest ich strefa komfortu. Czasami mocniejsze popchnięcie w kierunku nowszych rozwiązań powoduje, że ludzie otwierają oczy, że można coś zrobić pięć razy krócej.

Wpisywanie jakichś bzdurnych danych może wydarzać się w takich sytuacjach, kiedy ludzie są rozliczani z pewnych liczb, które wprowadzają do systemu. Jeśli mamy duże zaufanie do zarządzania w oparciu o dane, patrzymy na liczby, a nie rozmawiamy z ludźmi, i ktoś ma w celach rocznych odbycie stu rozmów z klientami, to on ma zachętę do tego, żeby wprowadzać, że właśnie dzisiaj już pięć razy do kogoś pojechał. Czy spotykacie się z takimi wypaczeniami systemów, w których połączenie z rozliczaniem pracowników z jakichś konkretnych liczb, kwot powoduje niepokojące zjawiska?

Osobiście chyba w żadnym projekcie nie spotkałem się z takimi sytuacjami, ale moi koledzy – tak. Jednym z nich była sieć sprzedaży jednego z producentów farmaceutyków. Te osoby raportowały jedne rzeczy poprzez swoje CRM-y, a kiedy wprowadzono monitorowanie floty, okazało się, że jest to rozbieżne. Zastosowanie business intelligence było takie, żeby nałożyć na siebie te informacje, które były pozyskiwane od dostawcy czy zarządcy floty, z tymi rzeczami, które wpisywane są w CRM, i potem przywoływać pracowników do porządku. Były też sytuacje związane z business intelligence departamentalnym, nie ma takiego ogólnego firmowego. Kierownicy dostosowują swoje wyniki, żeby ładnie to wyglądało na wykresie. Gdy potem przychodzą standardy ogólnofirmowe, to w tym momencie kierownicy denerwują się, bo ich wyniki podciągnięte pod tę samą kreskę jednak nie są takie, jak były pokazywane wcześniej.

Czy znasz przykłady informacji, które są ciekawe dla firmy, które można było uzyskać dzięki procesom business intelligence, ale które mniej nam się kojarzą z wynikami sprzedażowymi, liczbą spotkań czy jakąś analityką klientów? Czy któraś z firm miała nietypowe zastosowanie, coś, co nie dotyczyło bezpośrednio sprzedaży?

W tej chwili ciężko mi będzie coś powiedzieć na ten temat, ponieważ dużo mamy związku z finansami, robiliśmy np. analizy przypływów pieniężnych w firmie, takie cashflow. Kiedyś zrobiliśmy taki model dla jednej z firm, która zajmuje się windykacją. Zanim kupiła pakiet windykacyjny konsumencki, przepuszczała go przez stworzony przez nas model, opracowany na podstawie historii, i pokazywał on im, że z tej paczki długu będą mieli w tym miesiącu tyle, w tym tyle i w tym tyle. To pokazywało potencjalny zwrot z inwestycji. Może nie sprzedaż bezpośrednia, ale potencjał operacji finansowej. Tak biznesy zwykle działają, sprzedaż jest ich najważniejszym driverem, w zasadzie skupiamy się na wszystkim, co jest związane z kosztami, z przychodami firmy. Operacyjnie, owszem, też, ale każdy biznes inaczej. Mógłbym powiedzieć, że robiłem hurtownię dla czegoś takiego jak PKS u nas w Polsce, tam mogliśmy pokazywać np. przepływy pasażerów i to, jak pomagać w planowaniu linii autobusowych na poziomie krajowym. Oni robili takie główne korytarze, potem nitki dochodzące i analizowało się liczby pasażerów, które przepływały tymi nitkami po całym kraju.

Jak w praktyce technologicznie wygląda takie wdrożenie? Czy są gotowe platformy, z których się korzysta i które trzeba zintegrować z systemami u klientów, czy też są to rozwiązania tworzone od zera, które pozwalają wdrożyć w firmie business intelligence?

Generalnie wszystko da się napisać w formie aplikacji, ale to już nie będzie takie elastyczne, uniwersalne i monitorowalne. Poza tym będzie kosztować. Oczywiście duzi producenci, tacy jak Informatica, Oracle, Microsoft, SAP, mają pakiety, które pozwalają składować dane. W pierwszym przypadku to jest zwykle relacyjna baza danych, bo takie najlepiej sprawdzają się w business intelligence czy w hurtowniach danych. Na pewno dadzą się tam wykorzystać pakiety integracyjne, w których pobieramy dane z wielu różnych źródeł w wielu różnych formach czy też pobieramy dane ze źródłowych baz danych czy z ekstraktów, bo bardzo często izoluje się systemy źródłowe od hurtowni danych poprzez wprowadzenie ekstraktów. Na samej górze mamy najczęściej kostki analityczne jako taką formę uproszczenia czy interfejsu dla użytkownika biznesowego w formie źródła danych ze zdefiniowanymi relacjami. Plus narzędzia do produkcji raportów. To raportowanie jest z jednej strony klasyczne, korporacyjne, czyli piszemy jakieś sztywne raporty, które użytkownik wyciąga sobie z katalogu, uruchamia, odświeża, wprowadza parametry. I one są raczej bardziej statyczne albo nadające się do wydruku. Z drugiej strony na drugim końcu mamy coś takiego jak self-service BI, czyli danie pewnej wolności użytkownikowi biznesowemu, kiedy ci specjaliści od BI przygotują ładne źródło danych w postaci zestawu tabelek albo jakichś kostek analitycznych. Wtedy te osoby po prostu łączą się z tymi kostkami i układają sobie dane, raporty w taki sposób czy drążą te dane jak tacy bardziej zaawansowani użytkownicy. Mówi się, że self-service BI jest dla wszystkich, ale z tego, co usłyszałem kiedyś na jednej z konferencji, to self-service BI jest dla tych, co są bardziej self-service.

Coś w tym jest, bo żeby coś sensownego wyciągnąć z danych, to trzeba się chwilę zastanowić, aby nie zrobić sobie krzywdy, bo łatwo można wygenerować raport, który dajemy na wnioski albo jest niekompatybilny z tym, na co wcześniej patrzyliśmy.

Absolutnie, można zabrnąć.

Wspomniałeś o dwóch elementach tego systemu, które mogą nie być jasne. Wspomniałeś, że są bazy danych, które trzymają te na bieżąco gromadzone dane. Ale często robi się tak, że bezpośrednio z nich nie korzystamy, tylko robimy pośrednią warstwę ekstraktów. Czy masz tu na myśli osobną warstwę bazy danych, czy jakąś inną warstwę, która pozwala nam to odizolować od oryginalnych źródeł?

Zwykle patrząc na architekturę tych rozwiązań raportowych, na samym dole są te źródła danych, z których korzystamy. One są w przeróżnych formach, dlatego mówimy tu o integracji. Poziom wyżej zwykle tworzy się warstwę takiego ODS-a, czyli operational data store. To są tak naprawdę kopie danych źródłowych. One są pobierane w takich klasycznych hurtowniach po to, aby potem, jeżeli chcemy odświeżać dane czy przerabiać je dalej, nie obciążać systemów źródłowych. Bo jednym z problemów raportowania jest to, że jeżeli w aplikacji transakcyjnej mamy raportowanie, to jeżeli rośniemy z tymi danymi, rośniemy też często z liczbą raportów i uruchomieniami tych raportów, to one stają się kłopotem dla aplikacji transakcyjnej. Ich uruchamianie często obciąża aplikację i inni użytkownicy zaczynają się skarżyć na wydajność. Bardzo często następnym krokiem jest stworzenie replikacji tej bazy danych transakcyjnej i raportowanie z tamtej bazy tymi samymi raportami. A potem, jak już widzimy, że chcemy połączyć dane z innymi danymi, wtedy tworzy się hurtownia. Powyżej tzw. ODS-u tworzy się takie struktury, który są bliższe raportowaniu. Czyli mamy tak naprawdę nazwy tych kolumn, tabelek, które są bliżej użytkownika biznesowego. Tam jest napisane „sprzedaż”, „koszt”, a nie jakieś „TBR…”, tak po programistycznemu…

Czym są te kostki analityczne?

Hurtownia danych zwykle na końcu, na samej górze kończy się czymś, co nazywa się data mart, czyli takimi tematycznymi zestawami tabel, gdzie w jednej tabeli mamy zebraną sprzedaż, w innej – listę produktów, w kolejnej – listę klientów, kalendarz. Tak jakby upraszczamy ten nasz świat biznesowo-raportowy. Ale to wszystko siedzi na razie w tabelkach relacyjnych, które mimo dużych możliwości definicji, powiązań, prostych typów danych – wiemy, gdzie zrobić agregację – wymagają jednak od użytkownika trochę ekwilibrystyki. Bo jeżeli użytkownik zobaczy daną numeryczną, np. klucz klienta, i kwotę sprzedaży, to systemy raportowe zwykle traktują te dane jednakowo. One proponują agregację, ale nie dokonujemy takiej samej agregacji na identyfikatorze klienta jak np. na samej sprzedaży, bo tu będzie suma, a tu np. liczba wystąpień. Zestawienie tego w jeszcze jedną strukturę, którą nazywa się kostką analityczną, powoduje, że wszystkie relacje zostają usztywnione, tzn. my wiemy, jak ci klienci są połączeni z naszą sprzedażą, wiemy, jak to jest ładnie rozłożone po kategoriach produktu. Dodane są też funkcje takiej inteligencji czasowej, czyli np. miary, które pozwalają nam porównać się np. na rok wstecz czy zobaczyć, czy w poprzednim okresie mieliśmy wzrost, czy spadek. Możemy wprowadzić dodatkowe mierniki, tzw. key performance indicators, co często jest implementowane w kostkach, przeróżne hierarchie. To rozszerza możliwości tej relacyjnej bazy danych w potężne narzędzia analityczne. Takie, że użytkownik biznesowy jest w stanie o wiele, wiele szybciej operować danymi, które są ładnie ułożone w kostce, z tymi dodatkowymi elementami, o których wspomniałem, niż z samymi gołymi tabelami relacyjnymi.

Te kostki wykorzystujemy do tego, żeby robić raporty, dashboardy albo interaktywną analitykę.

Dokładnie. To jest źródło albo dla raportów, albo dla analityków, którzy zagłębiają się w te dane.

Czy warto w firmie wykształcić osobę, która będzie się w tym specjalizowała, znała na tym, np. modyfikowała te raporty, tworzyła nowy dashboard, jeśli ten poprzedni nam się znudził albo będziemy chcieli coś w nim zmienić?

Model pracy z takimi rozwiązaniami w firmach ma szerokie spektrum – od takiego stanu, że czasami nic nie robimy, wszystko zlecamy i tylko zewnętrzni specjaliści zajmują się takimi zmianami. Jest też druga strona, kiedy wszystko sami robimy wewnętrznie. Rzeczywiście wtedy trzeba nabyć odpowiednich kompetencji. Czasami jest to rozwiązanie pośrodku, tzn. firma sama otrzymuje np. raporty, bo to jest trochę łatwiejsze, sama potrafi ze
brać wymagania biznesowe. Potem trudniejsze rzeczy techniczne jest w stanie efektywnie przekazać firmie, która dostarcza takie rozwiązania, np. samą hurtownię albo hurtownię plus kostki. Bardzo często spotykanym przypadkiem jest to, że raporty pozostawia się po stronie klienta, one najczęściej się zmieniają. Tu też chodzi o to, żeby odpowiadać częściej na potrzeby firmy, bo w momencie kiedy ktoś się zorientuje, że albo potrzebuje zmodyfikować istniejący raport, albo dodać nowy, to jeżeli powie któremuś ze swoich współpracowników, że trzeba to zrobić, to może odbyć się w miarę szybko, ale jeżeli trzeba wystawić zlecenie dla firmy zewnętrznej, to już mogą być problemy. Jeżeli nie mamy otwartej umowy z dostawcą, w której rozliczamy się za zrobioną pracę, czyli zużyty czas, to zwykle robione jest to wnioskami zmian i wycenianiem itd., a to może trochę wydłużyć proces, co tak naprawdę jest jedną z bolączek business intelligence. Mamy narzędzia, które pozwalają szybko pozmieniać te raporty, ale procesy biznesowe czasem za tym nie nadążają. Jeżeli więc chcemy zachować balans, to proponowałbym przynajmniej tę część raportową objąć wewnątrz firmy, żebyśmy mogli szybciej reagować i szybciej mieć u siebie narzędzia do podejmowania decyzji.

Zastanawia mnie relacja między business intelligence a tym modnym ciągle big data. Faktycznie wiele firm ma dużo danych, szczególnie firmy zaangażowane w sprzedaż czy w funkcjonowanie w świecie on-line. Jak rozwiązania business intelligence mają się tu do big data? Czy chodzi o integrację różnych narzędzi, czy też są głębsze problemy, które musimy rozwiązać, jeśli chcielibyśmy takie duże dane analizować podobnymi narzędziami lub tymi samymi?

Zwykle jest i tak, i tak, to jest może kwestia sprowadzenia wszystkiego do podobnego mianownika. Bo business intelligence bardzo dobrze radzi sobie z big data. Big data jest trochę inną formą informacji transakcyjnej. Gdy wchodzimy na jakąś stronę, zostawiamy ślad – np. poprzez kliknięcie czy skrolowanie – to te dane zostają u dostawców analityki związanej ze śledzeniem stron. Nawet jeżeli mamy te surowe dane, np. logi z serwera albo serwerów, gdzie stoją nasze strony, to i tak te narzędzia, które występują w big data, doprowadzają do tego, że te dane są bardziej ułożone. Te formy przeznaczone do analityki są zwykle bardziej relacyjne. Nawet jeżeli mamy liczbę słów w jakimś tekście, to i tak doprowadzamy to do formy raportu relacyjnego, np. mamy słowo i liczbę wystąpień. Możemy tu wziąć jakiś identyfikator i listę miejsc, które ktoś odwiedził wraz z częstotliwością, czasem przebywania. To wszystko sprowadza się do takiej relacyjnej formy. Potem bierzemy te wyniki, big data plus narzędzia, które tam dookoła mieliśmy. One są traktowane jako jedno ze źródeł business intelligence, bardzo często później mieszają się dane relacyjne z tymi mniej relacyjnymi. Należy to traktować jako kolejny strumień danych do naszej analityki.

Czy chęć analizowania tych dużych danych, tych, które kiedyś wydawały się nieistotne, jak np. to skrolowanie po stronie, liczba wejść do nas na stronę, to, że np. ktoś długo na niej był, przeskrolował, to rzeczywiście jest trendem, że to wszystko chcielibyśmy wiedzieć i to nam daje coś więcej?

Absolutnie tak. Jeżeli mamy możliwości skorzystania z takich technologii, to łącząc ją z naszymi tradycyjnymi źródłami danych, tymi wewnętrznymi, jesteśmy w stanie dowiedzieć się o wiele więcej o tym, jak nasz biznes jest postrzegany z zewnątrz. Działy marketingu bardzo intensywnie korzystają z tych narzędzi. Google Analytics to w ogóle jest już standard wszędzie i na każdym poziomie. Podłączanie tego wszystkiego do naszych systemów CRM-owych jest już chyba normą, dodatkowo wskazuje na to, czym klient naprawdę się interesuje. To już jest i działa, tylko oczywiście ma coraz bardziej szczegółową i zindywidualizowaną formę. Myślę, że w tej chwili to bardziej automatyka, aby jak najmniej czasu spędzać nad tą analityką. Wnioski podsuwały się same przez narzędzia, którymi się posługujemy. Oczywiście tu jest wielkie wsparcie machine learning w tych procesach, bo ogarnięcie tak wielkiej ilości danych w zwykłej business intelligence byłoby bardzo trudne.

Czyli jako ten nowy trend wskazujesz taką samointerpretowalność tych wyników analiz, czyli jakieś dodatkowe modele, które nam pokazują nie tylko trendy czy wyniki bieżące, ale też mówią, co może się zdarzyć za chwilę i jak to interpretować?

Prognozy typu forecasty albo np. klasyfikacja zdarzeń, klientów albo dziedziny zainteresowania klientów, wzbogacanie danych wewnętrznych to są takie rzeczy, gdzie machine learning jest nieocenionym partnerem business intelligence w szybszym ogarnianiu tej masy danych, do której mamy dostęp.

Powiedziałeś, że w business intelligence można wyróżnić dwie trochę inne role, ale w związku z tym może moglibyśmy pokazać, jak zwykle wygląda ścieżka kariery ludzi, którzy zaczynają się tym zajmować. W jaki sposób trafiają do takich ról? Czy to są osoby, które wcześniej zajmowały się programowaniem, czy bardziej analizami, statystyką? Czy możesz przedstawić typową ścieżkę dla tej roli?

Ze ścieżkami bywa naprawdę różnie. Moja jest bardziej klasyczna, techniczna. Człowiek był programistą, zaczął zajmować się w większej ilości danymi, podczas częstszych rozmów z klientami okazało się, że raportowanie jest ważne. Ktoś potem pokazał, że raportowanie może być łatwe, a nie ciężkie. I to jest ścieżka techniczna. Warunkiem w obu przypadkach jest to, że musimy kochać dane i kochać obcować z danymi. Bo to jest taka praca u podstaw, w której ogląda się liczby, a potem przekształca się je na wykresy. To ścieżka stopniowego wchodzenia w analitykę, przechodzenia z systemów transakcyjnych na hurtownie, kiedy dowiadujemy się, czym jest wymiar, miara, fakty i hierarchie. Potem jesteśmy w stanie przełożyć wymaganie biznesowe raportowe na to, którego z tych pojęć użyć.

Z drugiej strony współpracuję też z osobami, które nie wywodzą się z tej branży, a były wręcz humanistami. One mają do tego zwykle podejście bardziej holistyczne. Są w stanie bardzo dobrze spojrzeć na wszystko z góry i dążyć do tego business intelligence od strony wiedzy, którą da się stamtąd pozyskać. Potrafią wejść szybko w buty klienta i powiedzieć, że klient będzie potrzebował takich numerków, takich określeń biznesowych i teraz – czy my gdzieś to mamy albo jak możemy sobie to wszystko ułożyć, przetransformować itd.? Więc, owszem, to trudniejsza ścieżka, bo trzeba się z pewnymi narzędziami zaznajomić, ale te narzędzia dla współczesnych producentów nie są ciężkie. To są zwykle interfejsy okienkowe, gdzie wszystko przeciągamy myszką. Owszem, SQL-a trzeba się na pewno nauczyć, bo to absolutna podstawa. Z innych technologii to MDX – język, który bardzo często występuje w różnych rozwiązaniach. Trzeba trochę liznąć programowania. Te mniej techniczne osoby muszą wiedzieć, czym jest zmienna, typy danych i chociażby piksele na tych raportach.

Kim dalej można zostać, jak pogłębiać swoją wiedzę? Wspomniałeś, że uczestniczysz w organizacji spotkań osób w tym obszarze. Jakie tematy poruszasz? W jaki sposób ludzie z tego obszaru znajdują obszar, w którym ciągle widzą, że mogą znaleźć coś nowego?

Teraz bootcampów jest bardzo dużo. Jeżeli ktoś chce rozwinąć się w jakimś kierunku – nieważne, w jakiej dziedzinie, czy to jest szydełkowanie, pieczenie ciast, pisanie aplikacji webowych – to jest w stanie znaleźć coś dla siebie. W dużych miastach jest łatwiej, bo tam zwykle odbywają się takie spotkania, ale źródła on-line’owe też są bardzo obszerne. Jesteśmy w stanie dużo wiedzy pozyskać z darmowych albo bardzo tanich źródeł, bardzo skoncentrowanych na to, gdzie można zacząć. Ale gdy ktoś już zaczął i chce się dalej rozwijać, to sporo jest też konferencji i meet-upów. Ostatnio otwieraliśmy oddział w Białymstoku, zjawiło się ok. 60–70 osób, podczas gdy spodziewałem się 20. Potrzeba chłonięcia wiedzy jest więc duża zarówno wśród osób, które dopiero zaczynają pracę z danymi, jak i tych, które już siedzą w tym dobrych kilka, a nawet kilkanaście lat. Pojawia się dużo webinarów on-line, podcastów oraz kursów. Jeśli mamy odłożonych trochę pieniędzy, to polecam kursy, bo ta dawka wiedzy będzie najbardziej intensywna. Jeżeli pójdziemy na meet-up czy na konferencję, to zwykle zobaczymy jakiś jednodniowy warsztat albo godzinną prelekcję, która pokaże kierunek, w którym można pójść, gdzie znaleźć materiały, ale żeby coś przećwiczyć, posłuchać eksperta w danej dziedzinie, to trzeba pójść do swoich HR-ów i wyciągnąć od nich trochę funduszy na szkolenie. I oczywiście tym, którzy są po szkole średniej, polecam studia.

Opowiedz coś na temat tych spotkań, które organizujesz.

W większości miejsc, w których jesteśmy, są to trzy godziny na miesiąc, dwie prelekcje. Jesteśmy na tyle prężną organizacją, że sami finansujemy swoje spotkania. W międzyczasie te prelekcje są na tyle interaktywne, że w dowolnym momencie można podnieść rękę i dociec jakiegoś tematu. Są tam osoby, które opowiedzą nam o danych tematach. One już bardzo długo tam działają, często są nauczycielami akademickimi, mają duże doświadczenie projektowe. Mówią często o swoich doświadczeniach, projektach albo o jakichś nowinkach. Bywa, że te najbardziej wyróżnione osoby mają bardzo często dostęp do produktów, które jeszcze nie były opublikowane. Mogą pokazywać rzeczy, które zobaczymy w przyszłości. Z drugiej strony zachęcamy te osoby, które nigdy jeszcze nie przemawiały, żeby wskoczyły na naszą scenę i pokazały, że też umieją mówić. Mamy wiele takich przypadków, kiedy taka osoba dwa, trzy lata temu pojawiła się u nas na scenie, a w tej chwili działa w naszych strukturach i pomaga nam w tym, co robimy. Spotkania są więc fajne, swobodne i bardziej nieformalne.

Dzięki wielkie za rozmowę. Myślę, że to było bardzo fajne spojrzenie na ten obszar, które może zachęcić wiele osób, aby się tym zainteresować. Do usłyszenia następnym razem!

Dziękuję i pozdrawiam wszystkich!

Komentarze

Możliwość komentowania jest wyłączona.