#552
Pozyskiwanie danych ze źródeł internetowych z wykorzystaniem Pythona
Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.
🟢 Warsztat weekendowy w godz. 9:00-17:00 (8h) 🟢
Czego się nauczysz?
Podczas warsztatu nauczysz się wykorzystywać dwie popularne metody ekstrakcji danych ze źródeł internetowych - web scraping oraz pracę z JSON API. Poznasz niezbędną teorię oraz wykonasz kilka praktycznych projektów.
Dla kogo jest ten warsztat?
Warsztat przeznaczony jest dla programistów Pythona oraz data scientistów, którzy chcą nauczyć się pozyskiwania danych ze źródeł internetowych. Zarówno web scraping jak i praca z webowymi API będą uczone od podstaw.
Wymagania wstępne
1. Swobodne posługiwanie się Pythonem w stopniu przynajmniej podstawowym
2. Znajomość (lub chęć poznania) środowiska Jupyter Notebook. W nim znajduje się omówienie materiału oraz część zadań praktycznych.
3. Podstawowa znajomość HTMLa (znaczniki, atrybuty)
2. Znajomość (lub chęć poznania) środowiska Jupyter Notebook. W nim znajduje się omówienie materiału oraz część zadań praktycznych.
3. Podstawowa znajomość HTMLa (znaczniki, atrybuty)
Prowadzący
Patryk Palej:
Od 2018 pracuje w obszarach analizy danych, uczenia maszynowego oraz programowania w Pythonie. Posiada background akademicki związany z matematycznym modelowaniem procesów fizycznych. Lubi dzielić się zdobytą wiedzą, a w wolnym czasie jeździ po świecie motocyklem.
Obecnie trener bootcampu Data Science PRO od Kodołamacza - datasciencepro.kodolamacz.pl.
Program warsztatów
- Przedstawienie tematyki warsztatu oraz możliwości zastosowania technik, o których będziemy się uczyć.
- Web scraping
- Wprowadzenie do bibliotek requests oraz bs4
- Wyciąganie treści z określonych elementów strony internetowej (przykłady oraz zadania)
- Projekt scrapera do pozyskiwania danych z portalu aukcyjnego
- JSON API
- Omówienie zasady działania webowych API oraz notacji JSON
- Kilka przykładów i zadań wykorzystujących wybrane API które oferują otwarty dostęp
Uwaga
Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.
Zapisy na wybrany warsztat zostały zakończone.