| Аннотация |
Современные методы высокопроизводительных исследований генерируют огромный массив информации по ключевым факторам регуляции транскрипции, в частности: ChIP-seq, ChIP-exo, DNase-seq, ATAC-seq, FAIRE-seq, MNase-seq, WGBS, CAGE-seq, RNA-seq, eQTL, GWAS, Hi-C. Однако данные недостаточно интегрированы друг с другом, что существенно затрудняет их совместное использование как для понимания механизмов регуляции транскрипции, так и для решения практических задач.
Коллективом авторов данной заявки c 2012 года разрабатывается и поддерживается база данных GTRD (https://gtrd.biouml.org). На данный момент GTRD – крупнейшая в России база генетической информации и одна из крупнейших в мире база по регуляции транскрипции (500+ TB). В настоящий момент база данных включает в себя наиболее популярные дизайны экспериментов, основанные на использовании высокопроизводительного секвенирования: ChIP-seq, ChIP-exo, DNase-seq, ATAC-seq, FAIRE-seq, MNase-seq, WGBS, CAGE-seq и RNA-seq для 10 видов организмов: Homo sapiens, Mus musculus, Rattus norvegicus, Gallus gallus, Danio rerio, Caenorhabditis elegans, Drosophila melanogaster, Saccharomyces cerevisiae, Schizosaccharomyces pombe и Arabidopsis thaliana.
База данных GTRD является крайне востребованной, широко используемой и цитируемой: 300+ цитирований по версии Semantic Scholar (https://www.semanticscholar.org/).
На основе информации из базы данных GTRD было создано несколько достаточно широко известных и популярных международных баз данных: HOCOMOCO, ADASTRA, ANANASTRA, BaMM motif, mSigDB (Molecular Signatures DataBase) C3: regulatory target gene sets.
Однако в базе данных GTRD отсутствуют набравшие за последние годы популярность эксперименты секвенирования отдельных клеток (single-cell, sc; Например, single-cell ATAC-seq).
Посколько упаковка ДНК и белок-хроматиновые взаимодействия представляют собой комплексную динамическую структуру, можно говорить о наличии высоковариабельных районов открытого хроматина, которые плохо детектируются методами, основанными на секвенировании клеточных популяций, ввиду гетерогенности рассматриваемых образцов. Новые экспериментальные технологии позволяют получать данные о регуляции транскрипции для отдельно взятых клеток. Планируется интегрировать данные scATAC-seq в базу данных GTRD. Будет проведено сопоставление результатов по отдельным клеткам с имеющимися в GTRD данными по открытому хроматину, а также интеграция и совместный анализ имеющихся данных по регуляции транскрипции. Таким образом будут получены новые знания о клеточной специфичности регуляции транскрипции на уровне единичных клеток.
В ходе проекта РНФ №20-74-10075 под рук. Кулаковского И. В. проводятся работы по аннотации аллель-специфичной доступности хроматина. В рамках развития нашего успешного партнерства с коллективом, мы объединим эти данные по аллель-специфичным сайтам с другими геномными разметками, представленными в нашей базе данных, что обогатит возможности исследователей по аннотации однонуклеотидных вариантов.
|