Универсальная поисковая протеомная машина на основе алгоритмов машинного обучения для работы с данными количественной протеомики, полученными с использованием методов хроматомасс-спектрометрии высокого разрешения

Название НИОКТР	Универсальная поисковая протеомная машина на основе алгоритмов машинного обучения для работы с данными количественной протеомики, полученными с использованием методов хроматомасс-спектрометрии высокого разрешения
Аннотация	Проект направлен на создание универсальной поисковой протеомной машины для идентификации белков в хроматомасс-спектрометрических данных. В настоящее время существует два основных подхода к проведению протеомных экспериментов: информационно-зависимый (DDA) и информационно-независимый (DIA), причем оба подхода основаны на масс-спектрах фрагментации пептидов. Кроме того, нашей группой активно развивается альтернативный подход DirectMS1, который основывается на масс-спектрах первого уровня без использования фрагментации. В первую очередь, в проекте будут детально изучены недостатки современных подходов по анализу данных типа DIA. В 2024 году вышла работа (10.1101/2024.06.01.596967), которая показывает, что активно используемые поисковые машины для DIA данных выдают результаты с сильно завышенным уровнем ложно-положительных идентификаций (FDR). Согласно предварительным исследованиям в нашей группе, мы обнаружили проблемы с достоверностью результатов количественного анализа белков в DIA данных, также выявили одну из базовых причин появления недостоверных результатов идентификаций и отдельно предполагаем, что метод DIA не будет хорошо работать в случае протеогеномики из-за большого количества ложно-положительных идентификаций вариантных пептидов. Таким образом, мы планируем детально разобраться в причинах и наличии ошибок, учесть их и создать свою поисковую машину для DIA данных. Кроме того, планируется существенно модифицировать нашу ранее созданную протеомную машину IdentiPy для DDA данных. В частности, в последние года активно создаются и применяются модели машинного обучения для предсказания хроматографических времен удерживания и масс-спектров фрагментации пептидов. Интеграция таких подходов в поисковую протеомную машину позволит значительно повысить эффективность протеомного анализа. Еще одной идеей проекта будет созданием универсальной поисковой протеомной машины для всех типов данных (MS1, DDA и DIA) на базе поисковой машины ms1searchpy, существующей на данный момент для подхода DirectMS1. В наших нескольких недавних работах мы применяли поисковик ms1searchpy для анализа данных DDA и DIA игнорируя масс-спектры фрагментации пептидов. Оказалось, что результаты количественного анализа белков на некоторых наборах данных таким образом получаются даже лучше, чем использование специализированных алгоритмов. Мы полагаем, что главным объяснением является белок-центричный подход (в отличии от пептид-центричного в обычных методах) и упор на эффективном извлечении пептидных изотопных кластеров в МС1 спектрах. Мы хотим создать универсальный протеомный поисковик на базе ms1searchpy, который бы работал как в текущем режиме, так и использовал бы масс-спектры фрагментации пептидов при их наличии. В качестве объекта исследований и биологического применения в проекте будут использованы различные раковые клеточные линии из панели ATCC. В частности, нас интересует механизмы защиты клеток от ферроптоза, которые можно наблюдать по дифференциально экспресированным белкам. Кроме того, мы хотим попытаться найти протеоформы белков (модификации и полиморфизмы), экспрессируемых в живых клетках и связанных с этим механизмом защиты. Наша недавняя работа по изучению болезни Альцгеймера показала возможную связь полиморфизма rs1130409 белка APEX1 с механизмом защиты от ферроптоза, но данный проект предполагает активное изучение и других белков, наблюдаемых в полнопротеомном анализе. Упомянутые клеточные линии будут подвергаться воздействию известных активаторов ферроптоза, таких как Erastin и Sorafenib (согласно работе doi.org/10.1038/s41420-022-01297-7) и будет проведен полнопротеомный анализ этих клеточных линий при разной степени воздействия. Таким образом, выполнение проекта позволит иметь программный комплекс для выполнения задач идентификации белков во всех активно используемых типах хроматомасс-спектрометрических данных, разработанный в России.
Доступ к ОКОГУ исполнителя	False
Количество связанных РИД	0
Количество завершенных ИКРБС	0
Сумма бюджета	18000.0
Дата начала	2025-09-10
Дата окончания	2028-06-30
Номер контракта	25-74-10042
Дата контракта	2025-09-10
Количество отчетов	1
УДК	577.2.01
Количество просмотров	47
Руководитель работы	Иванов Марк Витальевич
Руководитель организации	Иванов Владислав Сергеевич
Исполнитель	ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР ХИМИЧЕСКОЙ ФИЗИКИ ИМ. Н.Н. СЕМЕНОВА РОССИЙСКОЙ АКАДЕМИИ НАУК
Заказчик	Российский научный фонд
Федеральная программа	Отсутствует
Госпрограмма	—
Основание НИОКТР	Грант
Последний статус	2026-01-21 11:55:01 UTC, 2026-01-21 11:55:01 UTC
ОКПД	Нет
Отраслевой сегмент	—
Минздрав	—
Межгосударственная целевая программа	—
Ключевые слова	масс-спектрометрия; хроматография; биоинформатика; протеомные поисковые машины; количественный анализ белков; протеоформы белков; вычислительная протеомика; протеомика
Соисполнители	—
Типы НИОКТР	Фундаментальное исследование
Приоритетные направления	—
Критические технологии	—
Рубрикатор	34.15.01 - Общие вопросы
OECD	—
OESR	Биохимия и молекулярная биология
Приоритеты научно-технического развития	в) переход к персонализированной, предиктивной и профилактической медицине, высокотехнологичному здравоохранению и технологиям здоровьесбережения, в том числе за счет рационального применения лекарственных препаратов (прежде всего антибактериальных) и использования генетических данных и технологий;
Регистрационные номера	—