В эпоху бурного развития биотехнологий легко забыть, как сильно мы все еще полагаемся на щедрость мира природы. Одни микробы вызывают у нас болезни, другие поддерживают наше здоровье, в то время как другие продолжают давать нам лучшие лекарства в виде природных продуктов, таких как пенициллин и тетрациклин.
Новое достижение в области биоинформатики Университета Иллинойса раскрывает возможности технологии генома «больших данных», помогающей нам лучше использовать изобретения природы: группа исследователей во главе с доцентом химии Дугласом Митчеллом создала инструмент который просматривает микробные геномы, идентифицируя кластеры генов, которые указывают на способность организма синтезировать терапевтически многообещающие молекулы.
В статье в журнале Nature Chemical Biology ведущие авторы Джонатан Титц и Кристофер Швален и их коллеги из лаборатории Митчелла описывают, как их специальное программное обеспечение учится распознавать прогностические признаки генома.
«Поскольку секвенирование генома идет такими темпами… существует нехватка функциональной информации о том, что делают эти гены», - сказал Митчелл. «Все более важным становится понимание и интерпретация метаболических путей, особенно кластеров биосинтетических генов, кодируемых микробами."
Группа Митчелла особенно заинтересована в классе молекул, обычно называемых RiPPs, дружественной аббревиатурой от длинного названия: пептиды, синтезированные на рибосомах и посттрансляционно модифицированные. RiPPs, как и белки, состоят из цепочек связанных аминокислот, кодируются генами и подвергаются химической модификации (выполняемой другими белками) после их образования. По сравнению с белками RiPPs меньше, и модификации, которым они подвергаются, изменяют их структуру более резко.
RiPP могут показаться незнакомыми, но они уже присутствуют в повседневной жизни среднего потребителя. Вырабатываемый бактериями RiPP под названием низин, например, использовался в качестве добавки для борьбы с патогенами в молочных продуктах, мясе и напитках, таких как пиво, с 1960-х годов.
«РиПП имеют некоторые особые преимущества по сравнению с другими, более традиционными классами натуральных продуктов. Они обычно больше по размеру и имеют более сложную структуру», что позволяет им взаимодействовать с клеточным механизмом так, как не могут более мелкие молекулы, Титц. объяснил. Больше точек контакта со своими сотовыми целями означает, что RiPP могут лучше держаться и выполнять более сложные задачи. «В то же время, несмотря на их сложность, биосинтез RiPP… обеспечивает больший потенциал для генетической реинжиниринга натуральных продуктов с целью придания им физических и фармакологических свойств», - отметил он..
При всех своих преимуществах RiPP представляет собой проблему; трудно открыть новые. Традиционно исследователи находили потенциально полезные натуральные продукты путем скрининга микробов на основе их биологической активности. После десятилетий таких усилий, которые выявили целый ряд продуктов, включая некоторые RiPP, низко висящие плоды были сорваны; поиски снова и снова обнаруживают одни и те же общие соединения. Митчелл и его коллеги являются членами межлабораторной исследовательской группы в Институте геномной биологии Карла Р. Вёзе (IGB), которая нашла способ «подняться выше» и раскрыть новые природные продукты: анализ генома..
Тема исследования Mining Microbial Genomes в IGB направлена на ускорение открытия лекарств путем поиска в геномах микробов, по сути, просматривая книги рецептов клеток, чтобы увидеть, что они могут производить, прежде чем на самом деле убедить их сделать это. так в лабораторных условиях. Таким образом, исследователи могут значительно увеличить шансы на то, что им удастся выделить соединение, которое никогда раньше не встречалось. Однако этот метод основан на способности предсказывать, какую группу генов может произвести группа генов.
«В практическом смысле возник вопрос, есть ли лучший способ использовать доступные геномы для расширения этих конвейеров открытий», - сказал Швален. «Вот с чего мы начали».
Группа Митчелла столкнулась с трудной задачей: создать программное обеспечение, которое могло бы распознавать группы генов, продукты которых работают вместе для синтеза RiPP. Они решили сделать это еще сложнее, сосредоточившись на классе RiPP, называемых пептидами лассо, названными в честь их петлевой структуры. Кластеры генов, которые производят пептиды лассо, небольшие и выглядят как общие, что затрудняет их идентификацию даже при ручном поиске.
«Если вы хотите показать, что у вас есть полезный инструмент, вы выбираете самый сложный пример», - сказал Митчелл.«Но также, как химик, пептиды лассо чрезвычайно интересны. Пептиды, которые используются в качестве лекарств, нельзя давать перорально», потому что они будут переварены, объяснил он. «Пептиды лассо отличаются. Их можно кипятить, можно бросать в них протеазы, можно автоклавировать, и они не теряют своей активности, по сути, это маленькие пептидные узлы, чрезвычайно устойчивые к таким атакам».
Инструмент информатики, разработанный лабораторией Митчелла под названием RODEO (Rapid Open Reading Frame Description and Evaluation Online), частично справился с проблемой лассо с помощью подхода машинного обучения. Они обучили программное обеспечение на известных примерах кластеров генов, производящих лассо, что позволило программе отточить ключевые функции. Полученное программное обеспечение надежно идентифицировало многообещающие кластеры генов в широком спектре микробных геномов, и его можно было легко настроить для поиска кластеров генов других классов RiPPs..
RODEO идентифицировал 1300 новых пептидов лассо, в том числе несколько с особенно необычной структурой, которая делает их перспективными в качестве потенциальных терапевтических средств; исследователи подтвердили, что эмпирически определенные структуры соответствуют предсказанным программным обеспечением.
«Теперь мы можем использовать геномную приоритизацию для поиска молекул, которые, несомненно, являются структурно новыми», - сказал Митчелл. «Проблема в том, полезная ли это молекула или нет? Но чем больше молекул вы сможете соединить с генами, тем лучше мы будем информированы. Таковы следующие 10 лет открытий».