#157

Julia – jak zakochać się w analizie danych?

Julia – jak zakochać się w analizie danych? Algorytm genetyczny w 10 minut ? Big Data na komputerze PC ? Transformaty Fouriera i przewidywanie przyszłości ? W Julii to bardzo proste!

Julia to wysokopoziomowy, dynamiczny język programowania do obliczeń numerycznych. Zapewnia wyrafinowany kompilator, rozproszone wykonywanie równoległe, dokładność numeryczną i obszerną bibliotekę funkcji matematycznych. Praca w konsoli może być wspomagana wieloma prezentacjami graficznymi i interfejsem wg własnego pomysłu. Bardzo szybko rozwijający się system wspierany jest pakietami z wielu dziedzin nauki i biznesu. Julia może być idealnym narzędziem zarówno dla tych, którzy tworzyli dotąd w R czy C i innych językach programowania, ale też jest świetnym rozwiązaniem dla tych, którym nie wystarcza już wielkość i wydajność arkusza kalkulacyjnego i programów statystycznych. Julia pozwala na komputerze osobistym zanurzyć się w świecie Big Data i obliczeń numerycznych.

Julia jest bardzo szybka. Bywa, że identyczne zadania wykonuje tysiące razy szybciej od konkurencyjnych rozwiązań. Wyjątkowo szybko przetwarza zarówno liczby jak i tekst.

Dla uczestników przewidziany jest lunch oraz przerwy kawowe.

Żarówka

Czego się nauczysz?

W trakcie warsztatu:
- dowiemy się, jak korzystać ze środowiska Julia,
- napiszemy algorytm genetyczny do szukania optymalnych parametrów równia z wieloma parametrami,
- wykorzystamy ten algorytm do przewiadywania sprzedaży o dużej zmienność sezonowej,
- wykorzystamy i porównamy wiele algorytmów optymalizacyjnych do szukania optymalnej prognozy sprzedaży na wiele lat,
- wykorzystamy te algorytmy do przewidywania aktywności słońca na podstawie kilkusetletnich obserwacji jego aktywności,
- wykorzystamy Szybką Transformatę Fouriera do odkrycia składowych (widma) cykli aktywności słońca,
- dokonamy segmentacji tysięcy produktów poprzez analizę PCA (ang. principal component analysis) wykonując dekompozycję macierzy.
Grupa

Dla kogo jest ten warsztat?

Warsztat jest zarówno dla programistów, jak i dla analityków, którzy chcieliby uniezależnić się od sztywnych ram, jakie dają dedykowane programy statystyczne.

Prowadzący

Paweł Klimczewski:

Analityk, socjolog , elektronik. Ekspert z 25 latami doświadczenia w analiza mediów i rynku reklamy. Algorytmy personalizacji i optymalizacji e-treści i e-commerce. Rozwój złożonych systemów optymalizacyjnych, algorytmy genetyczne itp. Kilkunastoletni nadzór nad największym badań czytelnictwa na świecie. Planowanie mediów, doradztwo. Współpracy z wiodącymi instytutami badawczymi: Millward Brown, GFK, TNS. Bogate doświadczenie z pogranicza nauki, biznesu i cyfrowo wspomaganej optymalizacji złożonych procesów decyzyjnych. Udział w zespołach metodycznych PBC (Polskie Badania Czytelnictwa) i ZKDP (Audyt Dystrybucji Prasy ), badania telemetryczne TV i Internetu . Wszechstronne umiejętności, socjologia, badania społeczne, analiza statystyczna, fizyka, matematyka, nauki przyrodnicze. Wydajne systemy informatyczne do analizy statystycznej bardzo dużych zbiorów danych. Optymalizacja dystrybucji reklam w Internecie. Dobór odpowiednich technologii i rozwiązań informatycznych do rozwiązywania złożonych problemów optymalizacyjnych.

Program warsztatów

  1. Wprowadzenie do Juli – praca w konsoli , podstawowe komendy, nawigacja.
  2. Biblioteki Julii, przegląd i sposób korzystania.
  3. Instalacja i korzystanie z pakietów.
  4. Uruchamianie kodu z konsoli i z pliku : przykładowy algorytm genetyczny krok po kroku.
  5. Przewiadywania sprzedaży o dużej zmienność sezonowej implementacja algorytmów odwybranej metody.
  6. Wykresy i prezentacja wyników. Wykresy dynamiczne , animacje w Julii.
  7. Porównanie wielu różnych algorytmów , implementacja i zastosowanie pakietu.
  8. Import danych o aktywności słońca, implementacja napisanych wcześniej algorytmów do predykcji zachowań słońca.
  9. Analiza sygnałów, wykorzystanie biblioteki FTT (Szybka Transformata Fouriera ) do obliczania składowych widma cyklu aktywności słońca.
  10. Dekompozycja macierzy , analiza PCA (ang. principal component analysis), obliczanie głównych składowych i ich interpretacja , segmentacja zbioru w wielowymiarowej przestrzeniu.

Uwaga

W trosce o jakość warsztatów jesteśmy zmuszeni ograniczyć liczbę uczestników. **Kwalifikacja odbywa się na podstawie odpowiedzi udzielonych w formularzu zgłoszeniowym oraz - w dalszym kroku - kolejności zgłoszeń.** Potwierdzenie udziału w warsztatach wraz z instrukcją przygotowania środowiska otrzymasz najpóźniej na 7 dni przed planowaną datą wydarzenia.

Zapisy na wybrany warsztat zostały zakończone.