Pozyskiwanie danych ze źródeł internetowych z wykorzystaniem Pythona
Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.
? Warsztat wieczorny w godz. 17:00-21:00 (4 h) ?
Czego się nauczysz?
Podczas warsztatu nauczysz się wykorzystywać dwie popularne metody ekstrakcji danych ze źródeł internetowych - web scraping oraz pracę z JSON API. Poznasz niezbędną teorię oraz wykonasz kilka praktycznych projektów.
Dla kogo jest ten warsztat?
Warsztat przeznaczony jest dla programistów Pythona oraz data scientistów, którzy chcą nauczyć się pozyskiwania danych ze źródeł internetowych. Zarówno web scraping jak i praca z webowymi API będą uczone od podstaw.
Wymagania wstępne
1. Swobodne posługiwanie się Pythonem w stopniu przynajmniej podstawowym
2. Znajomość (lub chęć poznania) środowiska Jupyter Notebook. W nim znajduje się omówienie materiału oraz część zadań praktycznych.
3. Podstawowa znajomość HTMLa (znaczniki, atrybuty)
Prowadzący
Patryk Palej:
Od 2018 roku zajmuje się analizą danych, uczeniem maszynowym oraz programowaniem w Pythonie. W międzyczasie ukończył studia na kierunku Energetyka w trakcie których zajmował się matematycznym modelowaniem procesów transportu ciepła i masy. Szybko jednak przebranżowił się do IT i jako data scientist pracował przy projektach dla takich sektorów jak finanse, telekomunikacja czy media. Obecnie pracuje w firmie Ailleron nad rozwiązaniami dla sektora bankowego opartymi o sztuczną inteligencję. W Sages prowadzi szkolenia, warsztaty oraz zajęcia z zagadnień na pograniczu Pythona i data science.
Program warsztatów
Przedstawienie tematyki warsztatu oraz możliwości zastosowania technik, o których będziemy się uczyć.
Web scraping
Wprowadzenie do bibliotek requests oraz bs4
Wyciąganie treści z określonych elementów strony internetowej (przykłady oraz zadania)
Projekt scrapera do pozyskiwania danych z portalu aukcyjnego
JSON API
Omówienie zasady działania webowych API oraz notacji JSON
Kilka przykładów i zadań wykorzystujących wybrane API które oferują otwarty dostęp
Uwaga
Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.
Zapisy na wybrany warsztat zostały zakończone.
Ta strona korzysta z ciasteczek, aby świadczyć usługi na najwyższym poziomie. Dalsze korzystanie ze strony oznacza, że zgadzasz się na ich użycie.