#805

Wstęp do wyboru modelu liniowego i selekcji czynnikowej

Warsztat odbywa się w formie zdalnej za pośrednictwem platformy/komunikatora online, z wykorzystaniem dźwięku, obrazu z kamery, udostępniania ekranu komputera prowadzącego i uczestników.

🟢  Warsztat weekendowy w godz. 10:00-14:00 (4 h) 🟢

Żarówka

Czego się nauczysz?

Dowiesz się:
- dlaczego model liniowy nadal bywa często używany,
- po co zmniejszać liczbę parametrów w modelu,
- jak porównywać modele i wybierać najlepszy,
- czy modna regularyzacja zawsze daje lepsze wyniki niż metody krokowe,
- jak można zmniejszyć liczbę parametrów opisujących zmienną jakościową w modelu.
Grupa

Dla kogo jest ten warsztat?

Warsztat jest kierowany do osób, które zbudowały już swój pierwszy model regresji liniowej, ale nie zadowala ich jakość jego predykcji albo duża liczba parametrów utrudnia jego interpretację.
Notatnik

Wymagania wstępne

- Znajomość zagadnienia regresji liniowej,
- Podstawowa znajomość języka R.

Prowadzący

Agnieszka Sołtys:

Data Scientist i doktor nauk matematycznych w zakresie informatyki. W pracy jako Data Scientist najbardziej lubi zajmować się wizualizacją danych oraz budową modeli predykcyjnych, ale najwięcej czasu poświęca na pozyskanie, interpretację i czyszczenie danych. Agnieszka jest absolwentką matematyki i ekonomii na Uniwersytecie Warszawskim oraz studiów doktoranckich w IPI PAN w zakresie eksploracji danych. Posiada duże doświadczenie w prowadzeniu zajęć ze statystyki oraz uczenia maszynowego na Uniwersytecie Warszawskim i Politechnice Warszawskiej. W obszarze naukowym zajmuje się wyborem modelu liniowego, analizą danych z sekwencjonowania genów nowej generacji i modelami z błędem pomiaru. Jest autorką dwóch pakietów R na CRAN o nazwach DMRnet i DMR.

Program warsztatów

Na przykładzie rzeczywistych danych w programie R zostaną przedstawione i porównane różne metody wyboru zmiennych w modelu regresji liniowej.

Zostaną omówione kolejne zagadnienia:
1. Wczytanie i przyjrzenie się danym oraz macierzy planu,
2. Krótki wykład na temat kryteriów wyboru modelu takich jak błąd średniokwadratowy i kryteria informacyjne oraz przypomnienie kroswalidacji,
3. Omówienie następujących metod wyboru modelu i porównanie wybranych przez nie modeli na prawdziwych danych:
– metody krokowe,
– regularyzacja,
– selekcja czynnikowa, czyli wybór zmiennych ciągłych i łączenie poziomów w faktorach.

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do odwołania wydarzenia w przypadku niezgłoszenia się minimalnej liczby uczestników.
Zakupione certyfikaty zostaną przesłane uczestnikom w formie elektronicznej po warsztacie. Jeśli chcesz otrzymać zakupiony certyfikat w formie papierowej, zgłoś to mailowo na adres kontakt@stacja.it.

Zapisy na wybrany warsztat zostały zakończone.