109. Spotkanie Data Community, Warszawa – Jakub Pawlicki oraz Paweł Potasiński

2017-09-24 Michał Krużel Warszawa

Nasze myśli jeszcze krążą wokół Górnego Śląska, gdzie odbyło się drugie w Polsce wydanie SQL Saturday, a tu trzeba się zabierać za nasze lokalne spotkania. Ostatnio wspomnieliśmy nieco o Big Data i chcemy ten temat nieco pociągnąć, gdyż warto wiedzieć jak zmieni się nasz krajobraz danych za kilka lat, że na horyzoncie pojawią się jeziora, a między danymi czasem iskrzy.

Agenda:

18:00 – 18:15 Powitanie

18:15 – 19:30 Jakub Pawlicki – Wprowadzenie do PySpark API. Wykorzystywanie Apache Spark w Pythonie

Abstrakt:
Sesja będzie polegać na przerabianiu dużej ilości małych, samowystarczalnych przykładów wykorzystania PySpark’a. Przez to każda obecna osoba będzie mogła zobaczyc co to jest ten spark i dlaczego jest taki fajny.

Sesja nie będzie wymagała niczego od uczestników, poza posiadaniem przeglądarki internetowej. Każdy otrzyma URL do Jupytera, gdzie bedzie można przerabiać przykłady wraz z prowadzącym. Źródło danych będzie też przygotowane i pobieranie z niego danych przedstawione w każdym samowystarczającym przykładzie.

19:30 – 19:45 Networking, luźne rozmowy, i zapewne poczęstunek

19:45 – 21:00 Paweł Potasiński – Jak nie utonąć w jeziorze danych?

Abstrakt:
Jeziora danych (Data Lakes) stały się nie tylko modnym hasłem technologicznym, ale także integralną częścią nowoczesnej platformy przetwarzania danych dla biznesu. Coraz więcej organizacji podejmuje próby połączenia tradycyjnego świata danych relacyjnych ze światem Big Data. Celem prezentacji będzie zilustrowanie zasad działania jeziora danych na przykładzie usług Microsoft Azure (w szczególności Azure Data Lake i Azure Data Analytics).
(Level 200)

Biogramy:

Jakub Pawlicki
Jestem Generalistą zaczynającym swoją karierę jako Księgowy. Widząc jak można było usprawnić swoją (i zespołu) pracę operacyjną prostymi technikami programistycznymi, popłynąłem w tym kierunku. Miałem do czynienia z Oracle, Sql Serverem, Netezzą, Hadoopem, Sparkiem, R’em, Linuksem, SharePointem, VBA, Qlikview, Pythonem, C sharpem, ethereum i paroma innymi wynalazkami.

Paweł Potasiński
Chief Data Architect w firmie ITMAGINATION. Zawodowo przez 50% koncentruje się na transformowaniu Klientów ITMAGINATION w organizacje z sukcesem wykorzystujące dane do wspierania procesów biznesowych, a pozostałe 50% czasu pracy zajmuje mu kształcenie siebie i współpracowników na innowatorów w obszarze rozwiązań związanych z zarządzaniem danymi i informacją. Paweł posiada ponad 15-letnie doświadczenie zawodowe m.in. jako: administrator baz danych, programista SQL, konsultant business intelligence, trener, doradca technologiczny i menadżer produktu w Microsoft, a także wykładowca na czołowych warszawskich uczelniach. W 2007 założył Polską Grupę Użytkowników SQL Server (PLSSUG), której prezesem jest obecnie. Pięciokrotnie nagrodzony tytułem Microsoft MVP. Prywatnie domator, entuzjasta naukowego podejścia do analizy danych, fan efektywnych wizualizacji danych i zapalony biegacz.
Spotykamy się 5 października 2017 r. o godz. 18:00, w siedzibie firmy Microsoft, al. Jerozolimskie 195A w Warszawie

Wstęp wolny, ale konieczna jest rejestracja, która skończy się w dzień spotkania, przed południem.

Zapraszamy do zgłaszania swoich sesji. Jeśli wiecie coś, czego inni nie wiedzą, lub chcecie zgłębić temat, którego jeszcze nikt na naszej grupie nie przedstawiał: piszcie na warszawa@datacommunity.pl