Исследователи из Европейского института биоинформатики EMBL (EMBL-EBI) объединили свои знания в области бактериальной генетики и алгоритмов поиска в Интернете, чтобы создать поисковую систему ДНК для микробных данных. Поисковая система, описанная в статье, опубликованной в Nature Biotechnology, может позволить исследователям и агентствам общественного здравоохранения использовать данные секвенирования генома для мониторинга распространения генов устойчивости к антибиотикам. Сделав этот огромный объем данных доступным для обнаружения, поисковая система также может позволить исследователям больше узнать о бактериях и вирусах.
Поисковик микробов
Поисковая система под названием Bitsliced Genomic Signature Index (BIGSI) выполняет ту же задачу, что и поисковые системы в Интернете, такие как Google.
Количество секвенированных микробных ДНК удваивается каждые два года. До сих пор не существовало практического способа поиска этих данных.
Этот тип поиска может оказаться чрезвычайно полезным для понимания болезни. Возьмем, к примеру, вспышку пищевого отравления, причиной которой является штамм сальмонеллы, содержащий плазмиду лекарственной устойчивости («автостопный» элемент ДНК, который может распространять лекарственную устойчивость среди различных видов бактерий). Впервые BIGSI позволяет исследователям легко определить, видели ли плазмиду раньше и когда.
Google и другие поисковые системы используют обработку естественного языка для поиска на миллиардах веб-сайтов. Они могут воспользоваться тем фактом, что человеческий язык относительно неизменен. Напротив, микробная ДНК демонстрирует отпечаток миллиардов лет эволюции, поэтому каждый новый микробный геном может содержать новый «язык», которого никогда раньше не видели. Ключом к тому, чтобы заставить BIGSI работать, было найти способ построить поисковый индекс, который мог бы справиться с разнообразием микробной ДНК.
Мониторинг инфекционных заболеваний
«Мы были мотивированы проблемой борьбы с инфекционными заболеваниями и устойчивостью к антибиотикам», - объясняет Замин Икбал, руководитель исследовательской группы EMBL-EBI. «Мы знаем, что бактерии могут стать устойчивыми к антибиотикам либо в результате мутаций, либо с помощью плазмид. Мы также знаем, что можем использовать мутации в бактериальной ДНК как историческую запись бактериального происхождения. Это позволяет нам в некоторой степени сделать вывод о том, как бактерии могут распространяться по больничной палате, стране или миру. BIGSI помогает нам изучать все это в больших масштабах. Впервые это позволяет ученым задавать такие вопросы, как «был ли замечен этот штамм вспышки раньше?» или «распространился ли этот ген лекарственной устойчивости на новый вид?».
Быстрый и удобный поиск
«Эта поисковая система дополняет другие существующие инструменты и предлагает решение, которое можно масштабировать для огромных объемов данных, которые мы сейчас генерируем», - объясняет Фелим Брэдли, биоинформатик из EMBL-EBI. «Это означает, что поиск будет продолжать работать, поскольку объем данных продолжает расти. Фактически, это была одна из самых больших проблем, которые нам пришлось преодолеть. Мы смогли разработать поисковую систему, которую может использовать любой, у кого есть Интернет. соединение."
«Поскольку секвенирование ДНК становится дешевле, мы увидим целый ряд новых пользователей, не занимающихся фундаментальными исследованиями, и быстрое увеличение объема генерируемых данных», - продолжает Икбал.
«Вероятно, мы увидим, как секвенирование ДНК будет использоваться в клиниках или в полевых условиях для диагностики пациентов и назначения лечения, но мы также можем увидеть его использование для ряда других вещей, таких как проверка того, какой тип мяса есть в бургере. Сделать данные геномики доступными для поиска на данном этапе очень важно, и это позволит нам узнать огромное количество информации о биологии, эволюции, распространении болезней и многом другом».
Зачем нам микробы?
Микроб - это живое существо, которое слишком маленькое, чтобы его можно было увидеть невооруженным глазом, и для его изучения требуется микроскоп. «Микробы» - это общий термин, используемый для описания различных типов форм жизни, включая бактерии, вирусы, грибки и т. д.
Небольшая, но важная часть микробов, в первую очередь некоторые специфические виды бактерий и вирусов, вызывают инфекционные заболевания. Когда бактерии способны «пережить» лечение антибиотиками, они становятся чрезвычайно опасными для пациентов. Это все чаще происходит во всем мире и известно как устойчивость к антибиотикам.
Сравнивая ДНК нескольких видов бактерий, мы можем начать понимать, как они связаны, и изучать динамику устойчивости к антибиотикам по мере ее распространения - как географически, так и между видами. Например, анализ ДНК может помочь нам предсказать, насколько опасен определенный штамм туберкулеза и какие лекарства могут реагировать на этот конкретный штамм.