#1132

Hugging Face Transformers w analizie danych tekstowych – NLP w praktyce

Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.

🟢 Warsztat weekendowy w godz. 9:00-17:00 (8 h) 🟢

Żarówka

Czego się nauczysz?

- Czym są modele typu transformer i jak działają,
- Jak korzystać z gotowych modeli Hugging Face (pipeline, klasyfikacja, analiza sentymentu),
- Jak przetwarzać dane tekstowe i przygotować je do analizy,
- Tworzenie własnych pipeline’ów NLP i tokenizacja tekstów,
- Wprowadzenie do embeddingów i analizy semantycznej tekstu,
- Wykorzystanie modeli w aplikacjach: klasyfikacja, ekstrakcja informacji, clustering.
Grupa

Dla kogo jest ten warsztat?

Warsztat jest skierowany do osób, które chcą wykorzystać możliwości dużych modeli językowych w praktyce. Będzie szczególnie przydatny dla:
- Analityków danych pracujących z tekstem,
- Data scientistów i badaczy NLP,
- Specjalistów AI i osób zajmujących się automatyzacją analizy danych,
- Osób zainteresowanych wykorzystaniem Hugging Face w biznesie, nauce i projektach open source.
Notatnik

Wymagania wstępne

- Podstawowa znajomość Pythona i pracy z danymi (np. pandas),
- Nie wymaga instalacji – wszystko realizujemy w Google Colab,
- Uczestnik potrzebuje jedynie konta Google i przeglądarki.

Prowadzący

Marcin Wierzbiński:

Analityk danych, badacz AI i wykładowca na Uniwersytecie Warszawskim, współpracował z Instytutem Max Planck w Berlinie. Specjalizuje się w uczeniu maszynowym, analizie danych genetycznych i zakresu przetwarzania danych na dużą skalę. Prowadzi kursy z analizy danych i deep learningu. Autor publikacji naukowych i popularnonaukowych, współpracował m.in. z deepsense.ai i Sano Centre for Computational Medicine.

Program warsztatów

9:00 – 11:00 Wprowadzenie do NLP i modeli typu transformer:
– NLP w praktyce: zastosowania i wyzwania,
– Co to są modele transformer, LLM, embeddingi.
11:00 – 12:00 Hugging Face w praktyce – szybki start z pipeline’ami:
– Gotowe modele i ich zastosowania: analiza sentymentu, klasyfikacja,
– Dekodowanie, tokenizacja i predykcja tekstu.
12:00 – 13:00 Przerwa obiadowa
13:00 – 14:00 Embeddingi tekstowe i eksploracja semantyki:
– Co to są embeddingi? Jak je uzyskać i jak porównywać teksty,
– Wizualizacja i clustering tekstu z wykorzystaniem PCA/UMAP.
14:00 – 17:00 Case study i ćwiczenia praktyczne:
– Praca z własnymi danymi,
– Praktyczne zadania i sesja Q&A.

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.

Zapisz się na warsztat

Dieta (pomiń przy warsztatach zdalnych)

Zostałem/am poinformowany/a, że wydarzenie będzie nagrywane przez Organizatorów. W przypadku publikacji całego bądź fragmentu nagrania wizerunek uczestników nie będzie rozpowszechniany - ewentualnej publikacji na stronach internetowych oraz kanałach społecznościowych Organizatorów podlega tylko część prezentacyjna spotkania, bez aktywnego udziału uczestników. W przypadku warsztatów odbywających się na sali wydarzenie będzie fotografowane i filmowane przez Organizatorów. Wyrażam zgodę na rozpowszechnianie mojego wizerunku na zdjęciach i nagraniach z warsztatów, w szczególności na stronach internetowych oraz kanałach społecznościowych Organizatorów.

119,00 PLN

Sprawdź ofertę abonamentów

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników. Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektoronicznej po warsztacie oraz za pośrednictwem firmy kurierskiej.

Zapisz się na warsztat!