Понимание функций генов в бактериях, которые составляют часть человеческого микробиома - совокупности микробов, обнаруженных внутри нашего тела, - важно, потому что эти гены могут объяснить механизмы бактериальной инфекции или сожительства в организме хозяина, устойчивости к антибиотикам или множество эффектов, положительных и отрицательных, которые микробиом оказывает на здоровье человека.
Удивительно, но до сих пор неизвестны функции огромного количества микробных генов. Этот пробел в знаниях можно рассматривать как «геномную темную материю» в микробах, и ни вычислительная биология, ни современные лабораторные методы не смогли восполнить этот пробел.
Эта задача теперь решается благодаря международному сотрудничеству между Институтом исследований в области биомедицины (IRB Barcelona) и двумя другими междисциплинарными исследовательскими центрами, а именно IJS в Любляне (Словения) и RBI в Загребе (Хорватия). Результаты были недавно опубликованы в Microbiome, международном справочном журнале по исследованиям микробиома. Исследование возглавила Фрэн Супек, специалист по вычислительной биологии и руководитель лаборатории геномных данных в IRB в Барселоне, а первым автором выступила Ведрана Видулин, ученый-компьютерщик из центров в Словении и Хорватии..
Интеллектуальный метод прогнозирования
Исследователи разработали новый вычислительный метод, способный одновременно исследовать тысячи метагеномов и идентифицировать эволюционный сигнал, который может предсказать функцию многих микробных генов. Этот метод, который анализирует «большие данные» микробиомов человека (например, из кишечника или кожи) и других метагеномов (например,грамм. из почвы или океана) основан на особом алгоритме машинного обучения: он может создавать «деревья решений», чтобы предсказывать сотни различных функций сразу, находить связи между генами и в то же время предсказывать, что они делают в микробной клетке..
Это делает алгоритм очень хорошим в том, что он не путается из-за шума в метагеномных данных, а это означает, что он точен и может уверенно предлагать биологическую роль для большого количества генов с неизвестными функциями. Любопытно, что он также предлагает множество дополнительных функций для генов, которые уже играют какую-то известную роль», - говорит Супек.
Самый важный вывод, сделанный в результате этого исследования, заключается в том, что анализ микробиомов человека и других метагеномных данных, таких как данные о почве и океане, позволяет исследователям назначать сотни функций генов, которые ускользают от современных подходов вычислительной геномики. до нынешнего момента. «Другими словами, метагеномы позволяют ученым увидеть то, чего не видят обычные геномы», - объясняет хорватский исследователь, недавно получивший грант Европейского исследовательского совета (ERC).
Разнообразие является ключевым
Ученые обнаружили, что различные типы окружающей среды могут предсказывать различные типы функций генов. Например, метагеномы из океана можно использовать для предсказания генов, используемых бактериями для фотосинтеза. Но, как отмечают исследователи, это не могло быть обнаружено по бактериям в кишечнике человека. Напротив, кишечный микробиом оказался очень полезным для предсказания ключевых генов, участвующих в механизмах, лежащих в основе развития болезни, в метаболизме алкоголя и биосинтезе определенных аминокислот. среда.
Авторы приходят к выводу, что с помощью машинного обучения большой и разнообразный набор сред позволяет нам узнать о многих различных функциях генов у микробов. «Вычислительные методы, подобные этому, проливают свет на «темную материю» в микробных геномах - огромное количество генов у бактерий и архей, функции которых остаются загадкой», - говорит Супек.
Тысячи сгенерированных вычислительных прогнозов должны быть проверены в экспериментах. После проверки они могут привести к открытию новых генов, которые объяснят, как бактерии формируют экосистемы вокруг нас и даже экосистему внутри человеческого микробиома.