Seminarium instytutu
W poniedziałek 26 lutego w godz. 12:15-13:00 w sali 3/40 odbędzie się seminarium, podczas którego referat wygłosi mgr Adam Dohojda.
Tytuł: Wykorzystanie AI w celu przyporządkowania kierunków uczelnianych do dyscyplin naukowych poprzez uprzednią analizę NLP, w oparciu o teksty z encyklopedii internetowej.
Streszczenie
Podczas seminarium zaprezentowany zostanie model klasyfikujący kierunki studiów do dyscyplin naukowych na podstawie analizy tekstów sylabusów i programów studiów. Wykorzystując ogólnodostępne dane, jakimi są artykuły z Wikipedii, opracowano metodę przyporządkowującą kierunki studiów w sposób zgodny z ludzką intuicją. Kluczowymi etapami metody były: web scraping, czyli automatyczne pobieranie tekstów z artykułów internetowych; sentence embedding za pomocą syjamskich sieci BERT z biblioteki SentenceTransformers, co pozwoliło na zamianę tekstów na formę numeryczną; oraz zastosowanie i porównanie różnych modeli klasyfikujących z pakietu sklearn, w tym Lasów Losowych, Regresji Logistycznej, aż do wybrania najskuteczniejszego modelu – MLPClassifier. Następnie ten model dostrojony został za pomocą doboru optymalnych hiperparametrów, osiągając dokładność na poziomie około 74,32% na danych testujących. Ostateczne testy przeprowadzone na artykułach internetowych i treściach kierunkowych potwierdziły skuteczność klasyfikatora.