Исследование различных бактерий свидетельствует о большом прогрессе в предсказании функций генов: новый рабочий процесс ускоряет определение функций генов на основе экспериментов

Исследование различных бактерий свидетельствует о большом прогрессе в предсказании функций генов: новый рабочий процесс ускоряет определение функций генов на основе экспериментов
Исследование различных бактерий свидетельствует о большом прогрессе в предсказании функций генов: новый рабочий процесс ускоряет определение функций генов на основе экспериментов

В воздухе, под поверхностью океана и на суше микробы представляют собой крошечную, но могучую силу, регулирующую большую часть биогеохимических циклов планеты. Чтобы лучше понять их роль, ученые работают над идентификацией этих микробов и определением их индивидуального вклада. В то время как достижения в технологиях секвенирования позволили исследователям получить доступ к геномам тысяч микробов и сделать их общедоступными, с задачей назначения функций обнаруженным генам подобного сдвига не произошло.

Чтобы помочь преодолеть это узкое место, ученые Национальной лаборатории Лоуренса в Беркли (Berkeley Lab), в том числе исследователи из Объединенного института генома (JGI) Министерства энергетики США (DOE), разработали рабочий процесс, который позволяет проводить крупномасштабные, полногеномные анализы важности генов при многих состояниях. Исследование «Мутантные фенотипы для тысяч бактериальных генов с неизвестной функцией» было опубликовано в журнале Nature и на сегодняшний день является крупнейшим из когда-либо опубликованных исследований функциональной геномики бактерий.

«Это первая действительно крупная систематическая экспериментальная попытка определить функции бактериальных генов с неизвестной функцией», - сказал старший автор исследования и биолог Адам Дойчбауэр из отдела биологических наук лаборатории Беркли. «Мы решаем проблему, с которой столкнулась биология и которую признает: секвенировать очень легко, но в настоящее время мы не можем точно определить функции для большинства генов, идентифицированных с помощью секвенирования. Наши экспериментальные данные обеспечивают опору, которую другие исследователи могли бы использовать, чтобы сделать более обоснованный вывод о функции белка».

Протестированный на почти трех десятках бактерий из различных родов, рабочий процесс сочетает в себе высокопроизводительную генетику и сравнительную геномику для выявления мутантных фенотипов для тысяч генов с ранее неизвестными функциями.

Технологии для понимания генетического потенциала Земли

Команда работала с 32 бактериями, в том числе бактериями, способствующими росту растений, и цианобактериями, имеющими отношение к производству биотоплива, а также бактериями, участвующими в биоремедиации. «Обычно исследователи работают над функциональным анализом отдельных геномов ограниченного числа «рабочих лошадок» бактерий», - сказал ученый JGI Мэтт Блоу, соавтор исследования. «Это связано с ограниченными возможностями подходов функционального анализа по сравнению с высокопроизводительным секвенированием. Здесь у вас есть данные по 32 различным бактериям одновременно, что позволяет зафиксировать большее микробное разнообразие."

Чтобы более эффективно создавать библиотеки мутантов для каждой бактерии, команда усовершенствовала метод секвенирования штрих-кода ДНК, известный как RB-TnSeq (случайное секвенирование транспозона со штрих-кодом). «Последствия этой работы заключаются в том, что ее можно масштабировать при надлежащих инвестициях и координации - в сочетании с другими методами - чтобы получить существенную пользу для понимания генетического потенциала Земли», - сказал Адам Аркин, старший научный сотрудник факультета и соавтор..

«Технология, стоящая за этим проектом, была разработана для выяснения генетических функций всех организмов, которые мы собираем в полевых условиях, и для понимания важности приспособленности организмов в различных средах», - добавил он, выступая в качестве содиректора Беркли. Лаборатория [Научная область ENIGMA], крупнейшая и самая продолжительная программа Министерства энергетики по экологической биологии. «Мы считаем, что для того, чтобы понять средства - при наличии соответствующих данных - вы должны быть в состоянии предсказывать, контролировать и проектировать поведение в интересующей вас системе."

Консервативные фенотипы предполагают наличие функциональных ассоциаций

Deutschbauer отметил, что полученный в результате большой набор данных позволил команде получить представление о консервативных фенотипах организмов, а также найти модели совместной приспособленности среди генов, случаи, когда два гена имели схожие модели фенотипов во всех условиях., корреляция, которая предполагает, что они могут быть частью одного и того же пути. Например, они обнаружили, что гены с неохарактеризованным белковым доменом UPF0126 важны для роста на глицине у 11 различных бактерий, предполагая, что этот белковый домен участвует в транспорте глицина через клеточную мембрану. Он добавил, что изучение таких консервативных ассоциаций демонстрирует ценность идентификации фенотипов гомологичных генов у множества видов бактерий.

"Сравнительное исследование функциональной геномики бактерий раньше было невозможно, потому что большие наборы генетических данных были доступны только для нескольких бактерий, а те, которые существовали, обычно не были созданы с использованием одной и той же технологии, одной и той же методологии или одни и те же метаданные, поэтому сравнивать сложно», - сказал он.«Хотя мы экспериментально изучили относительно небольшое количество бактерий по сравнению с разнообразием, присутствующим в природе, наши данные актуальны для всех бактерий. Например, около 12 процентов всех неохарактеризованных белков у бактерий имеют гомологичный белок с функциональной фенотипической ассоциацией. наш набор данных."

Набор данных находится в открытом доступе для сравнительного анализа на сайте fit.genomics.lbl.gov, веб-среде, разработанной Морганом Прайсом, ведущим автором исследования, который также разработал мощные инструменты, такие как PaperBlast, для облегчения интерпретации результатов.

Аркин также видит будущие преимущества интеграции этого набора данных в такие системы, как JGI [система IMG/M] и [база знаний по системной биологии Министерства энергетики (KBase)], первая крупномасштабная система биоинформатики, которая позволяет пользователям загружать, анализировать и обмениваться информацией в единой интегрированной среде.

«Эти наборы данных предоставляют фантастическую возможность для инноваций в науке о данных для прогнозирования биологических функций», - сказал Аркин, генеральный директор KBase и ведущий исследователь.«В KBase мы уже работаем с JGI, чтобы интегрировать подобные данные вместе с филогенетическими, гомологическими и химическими отношениями сходства, чтобы распространять эту информацию по древу жизни и проектировать, например, улучшенные метаболические модели для организмов и сообществ, чтобы мы можем предсказать условия, которые больше всего повлияют на рост».