#241

Przetwarzanie danych z Apache Spark

Apache Spark – silnik do przetwarzania danych na dużą skalę – to narzędzie które cieszy się ogromnym i wciąż rosnącym zainteresowaniem. Sukces Sparka wynika z jego szybkości oraz łatwości użycia. Oferowany szeroki wachlarz możliwości przetwarzania danych powoduje, że znajduje on zastosowanie w większości systemów Big Data.

Podczas warsztatu uczestnicy korzystają z własnych komputerów.

Podczas warsztatu zapewniamy dostęp do kawy, herbaty, wody oraz ciastek. W porze obiadowej zapewniamy pizzę w wersji mięsnej lub wegatariańskiej.

Czego się nauczysz?

W trakcie warsztatu:
- zapoznasz się z architekturą i komponentami Sparka,
- poznasz podstawowe abstrakcje danych w Sparku,
- przeanalizujesz dane wykorzystując Spark SQL,
- zbudujesz model predykcyjny używając Spark ML.

Dla kogo jest ten warsztat?

Warsztat przeznaczony jest dla osób które chcą zapoznać się z możliwościami oferowanymi przez Apache Spark.

Wymagania wstępne

Wskazana jest podstawowa znajomość Pythona i SQLa.

Prowadzący

Patryk Pilarski:

Data scientist, trener. Zawodowo pracuje z danymi od ponad dwóch lat. Pasjonat technologii i przetwarzania danych w każdej skali. Mól książkowy. Uwielbia pisać opisy do wszelkiego rodzaju sekcji o sobie :)

Program warsztatów

Wprowadzenie do Apache Spark.
Zapoznanie z API.
Przetwarzanie i analiza zbioru danych
Budowa modelu ML.

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do zmiany lokalizacji wydarzenia oraz jego odwołania w przypadku niezgłoszenia się minimalnej liczby uczestników.

Zapisy na wybrany warsztat zostały zakończone.