Przetwarzanie danych z Apache Spark
Apache Spark – silnik do przetwarzania danych na dużą skalę – to narzędzie które cieszy się ogromnym i wciąż rosnącym zainteresowaniem. Sukces Sparka wynika z jego szybkości oraz łatwości użycia. Oferowany szeroki wachlarz możliwości przetwarzania danych powoduje, że znajduje on zastosowanie w większości systemów Big Data.
Podczas warsztatu uczestnicy korzystają z własnych komputerów.
Podczas warsztatu zapewniamy dostęp do kawy, herbaty, wody oraz ciastek. W porze obiadowej zapewniamy pizzę w wersji mięsnej lub wegetariańskiej.
Czego się nauczysz?
- zapoznasz się z architekturą i komponentami Sparka,
- poznasz podstawowe abstrakcje danych w Sparku,
- przeanalizujesz dane wykorzystując Spark SQL,
- zbudujesz model predykcyjny używając Spark ML.
Dla kogo jest ten warsztat?
Wymagania wstępne
Prowadzący
Data scientist, trener. Zawodowo pracuje z danymi od ponad dwóch lat. Pasjonat technologii i przetwarzania danych w każdej skali. Mól książkowy. Uwielbia pisać opisy do wszelkiego rodzaju sekcji o sobie :)
Program warsztatów
- Wprowadzenie do Apache Spark.
- Zapoznanie z API.
- Przetwarzanie i analiza zbioru danych
- Budowa modelu ML.
Uwaga
Zapisy na wybrany warsztat zostały zakończone.