Szczegóły grantu

Grant zamknięty

GO-055

2020-12-04

2021-12-04

Zastosowanie algorytmów przetwarzania języka naturalnego w analizie sekwencji białek z użyciem uczenia głębokiego

dr Aneta Polewko-Klim

Projekt realizowany w ramach 2-ch prac dyplomowych (licencjackich). Celem głównym projektu realizowanego w środowisku Python jest projekt, implementacja oraz porównanie algorytmów reprezentacji cech opartych o wybrane metody przetwarzania języka naturalnego dla problemu analizy danych sekwencji białek z użyciem uczenia głębokiego Cele szczegółowe stanowią: 1. Projekt i implementacja benchmarka dla badań skuteczności wybranych metod wektorowej reprezentacji sekwencji białkowych opartych o algorytmy przetwarzania języka naturalnego z użyciem uczenia głębokiego dla problemu klasyfikacji białek. 2. Porównanie metod wektoryzacji sekwencji (embeddings) przy wykorzystaniu danych białkowych sekwencji bakteriofagowych z bazy danych NCBI 3. Optymalizacja hyper-parametrów poszczególnych algorytmów wektoryzacji 4. Wybór optymalnej metody wektoryzacji białkowych sekwencji bakteriofagowych dla skutecznej klasyfikacji strukturalnych bakteriofagów.