#488

Pozyskiwanie danych ze źródeł internetowych z wykorzystaniem Pythona

Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.

🟢  Warsztat weekendowy w godz. 9:00-17:00 (8h) 🟢

Żarówka

Czego się nauczysz?

Podczas warsztatu nauczysz się wykorzystywać dwie popularne metody ekstrakcji danych ze źródeł internetowych - web scraping oraz pracę z JSON API. Poznasz niezbędną teorię oraz wykonasz kilka praktycznych projektów.
Grupa

Dla kogo jest ten warsztat?

Warsztat przeznaczony jest dla programistów Pythona oraz data scientistów, którzy chcą nauczyć się pozyskiwania danych ze źródeł internetowych. Zarówno web scraping jak i praca z webowymi API będą uczone od podstaw.
Notatnik

Wymagania wstępne

1. Swobodne posługiwanie się Pythonem w stopniu przynajmniej podstawowym
2. Znajomość (lub chęć poznania) środowiska Jupyter Notebook. W nim znajduje się omówienie materiału oraz część zadań praktycznych.
3. Podstawowa znajomość HTMLa (znaczniki, atrybuty)

Prowadzący

Patryk Palej:

Od 2018 pracuje w obszarach analizy danych, uczenia maszynowego oraz programowania w Pythonie. Posiada background akademicki związany z matematycznym modelowaniem procesów fizycznych. Lubi dzielić się zdobytą wiedzą, a w wolnym czasie jeździ po świecie motocyklem.

Obecnie trener bootcampu Data Science PRO od Kodołamacza - datasciencepro.kodolamacz.pl.

Program warsztatów

  1. Przedstawienie tematyki warsztatu oraz możliwości zastosowania technik, o których będziemy się uczyć.
  2. Web scraping
    1. Wprowadzenie do bibliotek requests oraz bs4
    2. Wyciąganie treści z określonych elementów strony internetowej (przykłady oraz zadania)
    3. Projekt scrapera do pozyskiwania danych z portalu aukcyjnego
  3. JSON API
    1. Omówienie zasady działania webowych API oraz notacji JSON
    2. Kilka przykładów i zadań wykorzystujących wybrane API które oferują otwarty dostęp

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.

Zapisy na wybrany warsztat zostały zakończone.