#964

Podstawy PySparka w analizie danych tabelarycznych

Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.

?  Warsztat wieczorny w godz. 17:00-21:00 (4 h) ?

Żarówka

Czego się nauczysz?

Nauczysz się podstawowej składni PySparka używanej do przetwarzania danych tabelarycznych.
Grupa

Dla kogo jest ten warsztat?

Warsztat jest przeznaczony dla osób, które chcą zacząć korzystać ze Sparka ale nie znają jeszcze składni używanej w bibliotece PySpark.
Notatnik

Wymagania wstępne

Znajomość biblioteki pandas nie jest konieczna, ale może być pomocna w zrozumieniu omawianych koncepcji.

Prowadzący

Patryk Palej:

Od 2018 roku zajmuje się analizą danych, uczeniem maszynowym oraz programowaniem w Pythonie. W międzyczasie ukończył studia na kierunku Energetyka w trakcie których zajmował się matematycznym modelowaniem procesów transportu ciepła i masy. Szybko jednak przebranżowił się do IT i jako data scientist pracował przy projektach dla takich sektorów jak finanse, telekomunikacja czy media. Obecnie pracuje w firmie Ailleron nad rozwiązaniami dla sektora bankowego opartymi o sztuczną inteligencję. W Sages prowadzi szkolenia, warsztaty oraz zajęcia z zagadnień na pograniczu Pythona i data science.

Program warsztatów

1. Czym jest Spark oraz PySpark?
2. Transformacje i akcje
3. Tworzenie dataframe’ów
4. Operacje odczytu oraz modyfikacji
5. Użycie składni SQL na dataframe’ach

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.

Zapisy na wybrany warsztat zostały zakończone.