Wyborczy Python – analiza danych i modelowanie statystyczne na podstawie wyników wyborów
🟢 Warsztat weekendowy w godz. 9:00-17:00 (8 h) 🟢
Czego się nauczysz?
- nauczy się pracować z bibliotekami do analizy danych - pandas oraz numpy,
- pozna zarówno podstawowe operacje na danych ustrukturyzowanych (data frame) oraz tablicach numpy, jak i te bardziej zaawansowane, które mogą przydać się w codziennej pracy z danymi,
- nauczy się przygotowywać środowisko wirtualne do pracy i pozna najlepsze praktyki z tym związane,
- nauczy się wizualizować dane przy użyciu pakietów matplotlib oraz seaborn,
- dowie się, jak wykorzystać modele liniowe do celów wnioskowania statystycznego - do tego wykorzystamy pakiet statsmodels, a także scikit-learn,
- zdobędzie solidne podstawy do dalszego rozwoju w uczeniu maszynowym.
Całość warsztatów będzie przeprowadzona z wykorzystaniem rzeczywistych danych społeczno-politycznych - na ich przykładzie poznasz techniki analizy danych, a zdobyte umiejętności wykorzystasz na co dzień w pracy lub we własnych projektach.
Dla kogo jest ten warsztat?
Wymagania wstępne
- VS code.
Prowadzący
Od 2020 roku zajmuje się analizą danych, tworzeniem modeli predykcyjnych oraz programowaniem w Pythonie. Przygodę z danymi zaczynał w branży FMCG jako młodszy analityk danych, gdzie razem z zespołem wspierał marketing i handel w podejmowaniu decyzji biznesowych w oparciu o analizę danych i modelowanie statystyczne. Pracując w szeroko pojętym sektorze finansowanym, tworzył rozwiązania automatyzujące procesy przepływu i obróbki danych oraz raportowania. Obecnie tworzy systemy predykcyjne na potrzeby sprzedaży, windykacji oraz rozwija wspólnie z zespołem aplikacje bazujące na modelach semantycznych LLM oraz computer vision. Zajmuje się ponadto tworzeniem backendu dla aplikacji webowych, także na potrzeby aplikacji ML.
Program warsztatów
1. Przygotowanie środowiska pracy, omówienie pojęcia i znaczenia środowiska wirtualnego,
2. Wprowadzenie do bibliotek pandas, numpy – poznanie nowych struktur danych – Series, DataFrame, numpy array,
3. Podstawowe operacje na danych ustrukturyzowanych i tablicach,
4. Omówienie zaawansowanych przypadków obróbki danych, z którymi spotkasz się rzadziej, ale prędzej czy później, więc warto je znać,
5. Przykłady automatyzacji codziennych zadań w pracy z danymi z wykorzystaniem pythona i pandasa,
6. Wizualizacja danych – matplotlib + seaborn,
7. Modelowanie statystyczne z wykorzystaniem statsmodels,
8. Różnice scikit-learn vs statsmodels,
9. Kilka słów o danych przestrzennych,
10. Wizualizacja wyników wyborów na mapie,
11. Czy wybory prezydenckie 2020 były sfałszowane.
Uwaga
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.
Zapisz się na warsztat
Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników. Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektoronicznej po warsztacie oraz za pośrednictwem firmy kurierskiej.