GO-035
2018-05-07
2023-02-10
Klasyfikacja danych strumieniowych generowanych w środowisku MOA przy pomocy niestadardowych odległości
mgr Kamil Ząbkiewicz
Klasyfikacja strumieni danych opiera się na budowie modelu z danych, w których występują cechy. W przypadku, gdy strumienie są generowane przez urządzenia pomiarowe, bądź wymiarowość samych danych jest duża, selekcja lub ekstrakcja cech może być czasochłonna i niewygodna. W związku z tym zostało zaproponowane inne podejście. Mianowicie, jest tu wykorzystywana dwójkowa natura danych. Pozwala ona na wprowadzenie tak zwanych odległości niestandardowych opartych na kompresji danych a także na funkcjach mieszających. Następnym krokiem jest dobór klasyfikatora wykorzystującego dane odległości. Klasyfikator powinien być jak najmniej skomplikowany, więc intuicyjnie wybór padł na metodę najbliższych sąsiadów. Posiada on tylko jeden parametr do strojenia - liczbę sąsiadów. W eksperymentach będzie wykorzystywane środowisko MOA, będące jednym z podstawowych narzędzi w testowaniu algorytmów zorientowanych na analizę strumieni danych.