#52

Wprowadzenie do Big Data i Apache Hadoop

Jesteś analitykiem lub programistą? Zastanawiasz się nad dalszym rozwojem w kierunku Big Data? Zrób pierwszy krok w kierunku poznania technologii Big Data i weź udział w jednodniowych warsztatach z ekspertem!

Program warsztatu oferuje szybki przegląd podstawowych technologii z ekosystemu Apache Hadoop. Oprócz prezentacji, dla uczestników jest przygotowany warsztat, gdzie w praktyce będą mieli okazję samodzielnie eksplorować zbiory danych.

Podczas warsztatów:

  • – zdobędziesz podstawową wiedzę, dotyczącą problemów skali Big Data,
  • – zrozumiesz algorytm MapReduce,
  • – poznasz narzędzia analityczne Pig i Hive,
  • – poznasz zalety i wady omawianych technologii.

Od uczestników wymagana jest podstawowa wiedza z SQLa, basha, Pythona (lub innego języka skryptowego) oraz Javy. Uczestnicy w trakcie zajęć korzystają z własnego sprzętu (wymagany komputer z min. 6GB RAM i procesorem Intel i5 lub nowszym/podobnym).

Zapewniamy nielimitowany dostęp do pysznej kawy oraz pizzę. ☺

Prowadzący

Radosław Stankiewicz:

jest specjalistą IT z szerokim zapleczem teoretycznym i praktycznym. Od 2006 roku zdobywa doświadczenia w różnych dziedzinach - od technologii mobilnych przez JEE po wdrażanie platform Big Data - a wszystko to w całej różnorodności projektów i środowisk m.in. bankowości, telekomunikacji, sektorze publicznym i startupach.

Program warsztatów

  1. Wprowadzenie do Big Data.
    1. Czym jest Big Data, BigTable, MapReduce.
    2. Pojęcia real time, batch w kontekście procesowania danych.
    3. Ekosystem Hadoop.
  2. Wprowadzenie do MapReduce i Hadoop.
    1. Architektura.
    2. HDFS and YARN.
    3. Map Reduce Framework.
    4. Map Reduce Streaming.
    5. Warsztat.
      1. HDFS.
      2. Map Reduce.
  3. Wprowadzenie do Pig.
    1. Architektura.
    2. Tryby pracy.
    3. Typy danych, słowa kluczowe.
    4. Składnia.
    5. Warsztat Pig.
  4. Wprowadzenie do Hive.
    1. Architektura.
    2. Tryby pracy.
    3. Typy danych.
    4. Składnia.
    5. Formaty danych.
    6. Porównanie z Pig.
    7. Warsztat Hive.
  5. Monitorowanie i zarządzanie klastrem.
    1. CLI.
    2. Przegląd Apache Ambari.

Uwaga

Liczba miejsc ograniczona! Organizator zastrzega sobie prawo do zmiany lokalizacji wydarzenia oraz jego odwołania w przypadku niezgłoszenia się minimalnej liczby uczestników.

Zapisy na wybrany warsztat zostały zakończone.