SORGO UwB

Numer

GO-035

Data rozpoczęcia

2018-05-07

Data zakończenia

2026-01-01

Nazwa

Klasyfikacja danych strumieniowych generowanych w środowisku MOA przy pomocy niestadardowych odległości

Kierownik

mgr Kamil Ząbkiewicz

Streszczenie

Klasyfikacja strumieni danych opiera się na budowie modelu z danych, w których występują cechy. W przypadku, gdy strumienie są generowane przez urządzenia pomiarowe, bądź wymiarowość samych danych jest duża, selekcja lub ekstrakcja cech może być czasochłonna i niewygodna. W związku z tym zostało zaproponowane inne podejście. Mianowicie, jest tu wykorzystywana dwójkowa natura danych. Pozwala ona na wprowadzenie tak zwanych odległości niestandardowych opartych na kompresji danych a także na funkcjach mieszających. Następnym krokiem jest dobór klasyfikatora wykorzystującego dane odległości. Klasyfikator powinien być jak najmniej skomplikowany, więc intuicyjnie wybór padł na metodę najbliższych sąsiadów. Posiada on tylko jeden parametr do strojenia - liczbę sąsiadów. W eksperymentach będzie wykorzystywane środowisko MOA, będące jednym z podstawowych narzędzi w testowaniu algorytmów zorientowanych na analizę strumieni danych.

Referaty

Niestandardowe odległości w klasyfikacji danych strumieniowych [TERW 2018]
Non-Standard Distance Measures in Data Stream Classification [DAMSS 2018]

Publikacje

Application of Normalized Compression Distance and Lempel-Ziv Jaccard Distance in Micro-electrode Signal Stream Classification for the Surgical Treatment of Parkinson’s Disease
Non-Standard Distances in High Dimensional Raw Data Stream Classification

Szczegóły grantu