44. Spotkanie DC Bydgoszcz i Toruń – Statystyki danych & Przetwarzania języka naturalnego (NLP)

2019-10-09 Tomasz Waloszek Bydgoszcz i Toruń, Spotkania

Zapraszam na pierwsze po wakacjach spotkanie Data Community Bydgoszcz i Toruń. Otwieramy nowy sezon spotkań naszej grupy.
Wstęp wolny, prosimy tylko o rejestrację na meetup.

Czas i miejsce:
środa 23 Października 2019, 18:00
Bydgoszcz, Biblioteka UKW, Karola Szymanowskiego 3

Agenda:

18:00 – 18:05 Wprowadzenie

18:05 – 18:50 Rafał Suchorski – “Statystyki danych – czy to jest istotne”

18:50 – 19:00 Networking

19:00 – 19:45 Artur Zygadło – “Wprowadzenie do przetwarzania języka naturalnego (NLP)”

O wystąpieniach:

Rafał Suchorski – “Statystyki danych – czy to jest istotne cz.1”

Jak napisano w oficjalnej dokumentacji SQL Server: “The Query Optimizer uses statistics to create query plans that improve query performance”. Wydaje się więc, że zrozumienie tego jak dbać o statystyki jest jednym z kluczowych punktów podnoszenia wydajności naszych serwerów.
Temat jest dość obszerny, więc podzieliliśmy go na dwie sesje: pierwsza poświęcona będzie temu, jak optymalizator zapytań korzysta ze statystyk w celu określenia liczebności zbiorów. Oczywiście będzie odrobina teorii (wzory i magiczna tabela oszacowań), ale przede wszystkim będziemy statystyki czytać tak jak robi to optymalizator zapytań. Obiecujemy minimalną ilość slajdów, bo około 4/5 sesji to demo.

Rafał Suchorski
Rafał zajmuje się tematami związanymi z SQL Server od 2005 roku. Obecnie pracuje jako administrator w firmie zajmującej się sprzedażą detaliczną, wcześniej administrował hurtowniami danych, tworzył kostki analityczne i pakiety ETL, wdrażał także systemy klasy ERP oraz wspomagające budżetowanie. Od 3 lat ma tytuł MCSE, przez chwilę był także certyfikowanym trenerem Microsoft.

Artur Zygadło – “Wprowadzenie do przetwarzania języka naturalnego (NLP)”

Prezentacja dotyczyć będzie przetwarzania języka naturalnego (ang. NLP) – gałęzi sztucznej inteligencji pozwalającej komputerom rozumieć pojęcia, którymi na co dzień posługują się ludzie: w mowie i piśmie. Dokonamy przeglądu problemów, które próbuje się
rozwiązać z użyciem NLP oraz sposobów ich rozwiązywania na przestrzeni lat, ze szczególnym uwzględnieniem głębokiego uczenia maszynowego. Pokażemy, jak reprezentuje się słowa w postaci wektorów liczb rzeczywistych na przykładach z języka polskiego.”

Artur Zygadło
Jest absolwentem bydgoskiej szóstki (matura 2012) i Politechniki Warszawskiej. Od września 2019r. pracuje jako Data Scientist w deepsense.ai, gdzie obecnie zmaga się z zagadnieniami wizji komputerowej. Wcześniej miał okazję m.in. współtworzyć (jako inżynier danych) asystenta głosowego Samsunga i odbyć staż w tematyce bazodanowej w CERN w Szwajcarii.