I.3.7. Utworzenie Centrum Uczenia Maszynowego (Center for Machine Learning)
Realizacja celu IDUB
- Podniesienie wpływu działalności naukowej prowadzonej na UW na rozwój światowej nauki.
- Doskonalenie jakości kształcenia studentów i doktorantów na kierunkach związanych z POB.
Nazwa POB/Grupy działań
Opis działania
Cel
Zwiększenie potencjału badawczego UW i poprawa efektywności badaczy w zakresie stosowania metod uczenia maszynowego. Efekt ma zostać uzyskany poprzez stworzenie nowej grupy analityków danych (ang. data scientists) świadczących pomoc techniczną przy konstruowaniu modeli uczenia maszynowego. Dostarczenie gotowych do użycia modeli pozwoli na znaczną redukcję ciężaru opanowania zaawansowanych technik komputerowych i obróbki danych, który leży teraz na osobach planujących badania naukowe z wykorzystaniem uczenia maszynowego.
Uzasadnienie
Uczenie maszynowe, dalej nazywane ML (ang. Machine Learning), pozwala na bardzo efektywne wykorzystanie danych analizowanych w ramach bardzo różnorodnych badań prowadzonych na UW. Podstawową przeszkodą stojącą na drodze zastosowania ML w obecnych lub planowanych działaniach zespołów badawczych jest konieczność opanowania zaawansowanych technik komputerowych koniecznych do sprawnej realizacji procesu tzw. trenowania. Wymaga to zatrudnienia specjalisty, lub wykształcenia odpowiedniego członka zespołu. Taka osoba jest zmuszona zajmować się zagadnieniami potencjalnie odległymi od istoty problemu badanego przez swój zespół. Wiele aspektów technicznych związanych z ML jest niezależne od konkretnego problemu (odpowiednia definicja strumienia danych, wydajna implementacja obliczeń, efektywne wykorzystanie zasobów obliczeniowych, umiejętność używania zaawansowanych technik obliczeń w chmurze). Kolejnym zagadnieniem jest dostęp do infrastruktury obliczeniowej. Trenowanie modeli w ramach ML wymaga znacznych mocy obliczeniowych oraz często niestandardowych urządzeń, np. kart graficznych (tzw GPU). Zakup takiego sprzętu nie jest optymalnym rozwiązaniem. Dużo bardziej wydajnym podejściem jest korzystanie z istniejącej infrastruktury oferowanej przez wyspecjalizowane jednostki lub zakupu czasu obliczeniowego oferowanego przez komercyjnych dostawców. W każdym z tych wariantów jest potrzebna odpowiednia wiedza i doświadczenie w dziedzinie technik komputerowych.
Metodologia działania
pracownicy Centrum będą śledzić bieżące postępy w dziedzinie ML, a następnie będą przekazywać tzw. „know-how” zespołom badawczym. Przekaz wiedzy będzie zachodził poprzez współpracę z zespołem badawczym zainteresowanym użyciem ML. Współpraca będzie polegała na przygotowaniu i uruchamianiu narzędzi ML dla danego zespołu. W miarę możliwości zespół Centrum będzie tworzył działający kod, pozwalający na przetwarzanie danych i uzyskanie wstępnych wyników ML. Selekcja zagadnień nad którymi będzie pracowało Centrum będzie się odbywała na zasadzie ciągłego naboru wniosków. W pierwszym etapie działania Centrum, w 2020 roku, przewiduje się realizację czterech wniosków, po jednym z każdego zaangażowanego Wydziału.
Oprócz współpracy z konkretnymi grupami badawczymi Centrum będzie organizowało szkolenia z użycia narzędzi ML.
Zadania
- gromadzenie wiedzy i doświadczenia w używaniu narzędzi związanych z ML:
- monitorowanie postępów w dziedzinie ML poprzez udział w szkoleniach i warsztatach poświęconych ML
- podnoszenie kompetencji członków Centrum poprzez implementację standardowych elementów ML (np. strumienie wejścia wyjścia, podział obliczeń na części, reprezentacja danych) w różnorodnych technikach
- zapoznanie się z różnymi możliwościami dostępu do infrastruktury obliczeniowej w szczególności oferowanej przez projekt PL-Grid, ale także komercyjne usługi obliczeń w chmurze jak Google Cloud, Amazon Web Services
- przekazywanie wiedzy grupom badawczym i wszystkim zainteresowanym osobom na UW:
- organizacja warsztatów z ML na UW raz lub dwa razy w ciągu roku
- udział w pracach grup badawczych poprzez bezpośrednie zaangażowanie lub opiekę nad studentami w zakresie wykorzystania ML
- zwiększenie widoczności i znaczenia istniejących inicjatyw związanych z ML: dofinansowanie organizacji konferencji PLinML organizowanej od kilku lat na MIMUW. Organizacja wykładu o ML dla szerokiej publiczności w ramach PLinML na wzór wykładów „Zapytaj Fizyka” prowadzonych na UW.
Jednostka koordynująca działanie
- Wydział Fizyki
Jednostki zaangażowane w realizację działania
- Wydział Fizyki
- Wydział Chemii
- Wydział Biologii
- Wydział Matematyki, Informatyki i Mechaniki