Využití hlubokých neuronových sítí pro predikci vazebné síly aptamerů při výběru sekvencí in vitro / Predicting Aptamer Binding Strength in In Vitro Sequence Selection Using Deep Neural Networks
- Authors
- Publication Date
- Jun 14, 2024
- Source
- Digital Library of the Czech Technical University in Prague
- Keywords
- License
- Unknown
Abstract
Práce se zabývá problémem zpracování SELEX experimentů pomocí hlubokého učení. Součástí práce je užití dopředné neuronové sítě, konvoluční neuronové sítě, obousměrné dlouhé krátkodobé paměti a metody náhodného lesu pomocí programovacího jazyku Python a porovnání jejich schopnosti predikovat výsledky SELEX experimentů. Práce rozšiřuje předchozí výzkum schopnosti vázání aptamérů na protein trombin pomocí Restricted Boltzmann Machines a nabízí více přístupů ke zpracování tohoto problému. Odhady vybraných modelů dosáhly vysoké přesnosti na souboru dat prezentovaném v předchozím výzkumu. Při testování na dodatečně vytvořených datech měly modely potíže s predikcí schopnosti aptamerů se vázat, a proto byly považovány za nedostatečné pro využití v medicíně. Výsledky jednotlivých modelů a přístupů jsou porovnány. Ze všech algoritmů ukázaly nejlepší úspěšnost alogitmy Restricted Boltzmann Machines a následně Random Forests. / This thesis addresses the problem of processing SELEX experiments using deep learning. The work includes employing a Feed-Forward Neural Network, a Convolutional Neural Network, a Bidirectional Long Short-Term Memory, and a Random Forest using the Python programming language and comparing their ability to predict the results of SELEX experiments. The thesis expands on previous research on aptamers' binding ability using Restricted Boltzmann Machines and offers multiple approaches to handling this problem. The selected models' predictions achieved a high accuracy on a dataset presented in previous research. When tested on additionally generated data, the models had difficulty differentiating between binders and non-binders and, therefore, were concluded as insufficient for use in the medical field. The results of individual models and approaches are compared. Of all the algorithms, the best performance showed the Restricted Boltzmann Machines followed by Random Forests.