Szczegóły grantu

GO-035

2018-05-07

2023-02-10

Klasyfikacja danych strumieniowych generowanych w środowisku MOA przy pomocy niestadardowych odległości

mgr Kamil Ząbkiewicz

Klasyfikacja strumieni danych opiera się na budowie modelu z danych, w których występują cechy. W przypadku, gdy strumienie są generowane przez urządzenia pomiarowe, bądź wymiarowość samych danych jest duża, selekcja lub ekstrakcja cech może być czasochłonna i niewygodna. W związku z tym zostało zaproponowane inne podejście. Mianowicie, jest tu wykorzystywana dwójkowa natura danych. Pozwala ona na wprowadzenie tak zwanych odległości niestandardowych opartych na kompresji danych a także na funkcjach mieszających. Następnym krokiem jest dobór klasyfikatora wykorzystującego dane odległości. Klasyfikator powinien być jak najmniej skomplikowany, więc intuicyjnie wybór padł na metodę najbliższych sąsiadów. Posiada on tylko jeden parametr do strojenia - liczbę sąsiadów. W eksperymentach będzie wykorzystywane środowisko MOA, będące jednym z podstawowych narzędzi w testowaniu algorytmów zorientowanych na analizę strumieni danych.

  • Niestandardowe odległości w klasyfikacji danych strumieniowych [TERW 2018]
  • Non-Standard Distance Measures in Data Stream Classification [DAMSS 2018]
  • Application of Normalized Compression Distance and Lempel-Ziv Jaccard Distance in Micro-electrode Signal Stream Classification for the Surgical Treatment of Parkinson’s Disease
  • Non-Standard Distances in High Dimensional Raw Data Stream Classification