| Аннотация |
Исследование направлено на разработку нового гибридного метода, комбинирующего механистическую модель метаболизма клеток и глубинные нейросетевые подходы, для предсказания фенотипа по полногеномному генотипу. Проект мотивирован задачей предсказания лекарственной устойчивости (ЛУ) возбудителя туберкулеза, при этом, предлагаемый метод требует разработки нового математического и вычислительного подхода, который будет являться основным результатом проекта. Сложность задачи предсказания лекарственной устойчивости объясняется большим числом факторов при ограниченном объеме данных, доступных для обучения моделей, следовательно требуется использовать дополнительные источники информации о связи фенотипа с генотипом, которые необходимо интегрировать с моделями глубинного обучения. Таким источником информации послужит полногеномная метаболическая модель (ПММ) - экспериментально построенная модель, характеризующая все (или большинство) химических реакций, протекающих в клетке. Кроме того, предлагаемый подход позволит определять биохимические механизмы лежащие в основе возникновения ЛУ.
Возбудитель туберкулеза, Mycobacterium tuberculosis (MTB), являлся главной причиной смертности от инфекционных заболеваний в период до пандемии COVID-19 и вернул первенство сразу после ее окончания. Благодаря эффективной терапии заболеваемость туберкулезом в РФ и в мире в целом снижается, при этом угрожающе растет доля устойчивых форм туберкулеза, в связи с чем, раннее выявление ЛУ и индивидуальный подбор комбинаций эффективных препаратов приобретает высокую значимость. В настоящее время в мире, особенно в развитых странах, внедряются генетические методы, основанные на определении наличия мутаций, вызывающих ЛУ, в определенных генах. Генетические методы для отдельных препаратов с хорошо изученными механизмами действия имеют точность, сопоставимую с золотым стандартом - фенотипическими методами, однако, для других препаратов их чувствительность существенно ниже. Актуальной задачей является разработка новых подходов для предсказания лекарственных фенотипов для таких препаратов. В настоящее время, в лучшем случае, для обучения моделей доступны множества размерами порядка 10^4 генотипов, при размере генома бактерии порядка 10^6, что делает сложной задачу применения глубоких нейронных сетей (НС) для поиска вспомогательных, более редких механизмов ЛУ. Мы планируем разработать новые интерпретируемые модели МО для предсказания ЛУ MTB и полногеномных ассоциативных исследований (ПАИС), обладающие меньшими требованиями к размерам обучающих множеств за счет использования информации о сравнительной эволюции белков в геноме для агрегирования редких мутаций в признаки, определяющие их функциональное влияние, а также за счет использования информации о взаимодействии генов в виде полногеномной метаболической модели.
|