Zapraszamy na jubileuszowe marcowe spotkanie śląskiego oddziału Data Community o okrągłym numerze 0x50. Odwiedzą nas Łukasz Grala i Marek Adamczuk. Będzie o uczeniu maszynowym w najnowszej wersji SQL Server oraz bardzo ciekawym i wymagającym wdrożeniu analityki na dużym systemie transakcyjnym. Dla uczestników mamy tradycyjnie przekąskę i networking.
Spotykamy się w czwartek 29 marca 2018 r. o 17:55 w siedzibie Altkom S.A. w Katowicach, ul. Opolska 22 piętro III (wejście obok klubu SPIŻ Katowice, w windzie proszę nacisnąć przycisk IIIA). Lokalizacja na mapie: https://goo.gl/maps/EVRb12QqiBF2
Agenda
17:55 – 18:00 — Powitanie, rozpoczęcie spotkania
18:00 – 19:00 — “ML Server w SQL server 2017” – Łukasz Grala
19:00 – 19:30 — Przerwa integracyjna, networking
19:30 – 20:30 — “Case study – wdrożenie rozwiązania klasy Transactional Analytics” – Marek Adamczuk
20:30 – 20:40 — Zakończenie spotkania.
Rejestracja — wstęp wolny, ale bardzo prosimy o rejestrację na stronie https://www.meetup.com/PLSSUG/events/248903925/
ML Server w SQL server 2017
SQL Server obecnie stał się uniwersalną platformą do przetwarzania danych. Od danych w modelu relacyjnym, typów hierarchicznych, danych geograficznych i geometryczny, dane XML, JSON, a także teraz modele danych grafowych. To jednak nie wszystko z poziomu starego i poczciwego TSQL możemy również używać zaawansowanych algorytmów uczenia maszynowego do predykcji naszych danych. W czasie sesji zobaczymy jak łatwo wykorzystywać modele zarówno w procedurach składowanych, ale także jako klauzula zapytań w „zwykłych selektach”.
ŁUKASZ GRALA
Architekt danych w TIDK. Od ok. 25 lat zajmujący się danymi. Założyciel TIDK – Data Scientist as a Service – specjalizującej się w zaawansowanej analityce, uczeniu maszynowym, data science, Big Data Analytics. OD 2010 roku Microsoft MVP Data Platform. Naukowo związany z Wydziałem Informatyki Politechniki Poznańskiej w obszarze uczenia maszynowego i eksploracji danych. Członek zarządu PTI Wielkopolska. Lider Data Community.
Case study – wdrożenie rozwiązania klasy Transactional Analytics
Wyobraźmy sobie bazę, której główne tabele mają setki milionów rekordów. Pracują na niej jednocześnie setki użytkowników w trybie 24/7/365 – oczekiwana czterodziewiątkowa niezawodność. Zapisują setki rekordów na sekundę. Jednocześnie na tych samych danych co kilka sekund uruchamiają raporty czytające dowolny (czasem wieloletni) zakres danych w oparciu o dziesiątki kryteriów. Biznes wyklucza jakiekolwiek opóźnienie na ładowanie danych i oczekuje odpowiedzi na dowolną kombinację kryteriów w nie dłużej niż 30 sekund (timeout aplikacyjny). Nie ma też mowy o jakiejkolwiek zmianie aplikacji – wszystko musi stać się po stronie bazy danych. Cała logika zapisu i odczytu musi zostać zachowana.
Na całość restrukturyzacji mamy dwa osobomiesiące. W tym czasie mamy wdrożyć rozwiązanie i przetestować na dziesiątkach tysięcy realnych przypadków. Dodatkowo, mamy zminimalizować wysiłek wewnętrznego IT w utrzymaniu nowej funkcjonalności i zapewnić natychmiastowy powrót do stanu poprzedniego w wypadku jakiegokolwiek niepowodzenia. Wdrożenie produkcyjne ma nie przerwać pracy użytkowników.
Na szczęście raporty po stronie bazy mają postać procedur SQL. Mamy też solidny, kilkuwęzłowy klaster z SQL Server 2016 Enterprise Edition i Always on. Pokażę, jak wykorzystać nowe zabawki, jakie daje nam SQL Server 2016, aby ten cel osiągnąć. Jak nietrudno się domyślić, główną rolę odegrają indeksy kolumnowe. Opowiem i pokażę, na jakie problemy się natknęliśmy i w jaki sposób poradziliśmy sobie z postawionymi wymaganiami.
MAREK ADAMCZUK
Aktualnie Technical Team Leader w APN Promise. Lubię metodyki zwinne: trzy z czterech zespołów, z którymi pracuję, budują rozwiązania z użyciem metodyki Scrum. Z SQL Server pracuję od zeszłego tysiąclecia. Buduję i przebudowuję systemy, wdrażam, szkolę, audytuję, doradzam. Prywatnie biegam, chodzę po górach i gram w tenisa.
Zapraszamy do rejestracji i do zobaczenia!