Aequatus - новый инструмент биоинформатики, разработанный в Earlham Institute (EI) - помогает получить углубленное представление о синтетической информации между различными видами, предоставляя систему для лучшего выявления важных, положительно отобранных и эволюционно- консервативные области ДНК.
Как правило, близкородственные организмы демонстрируют высокую степень синтении, т. е. они обладают сходными последовательностями на своих хромосомах, где близкородственные гены, которые, как предполагается, имеют одинаковую функцию, группируются в сходной организации между видами. Таким образом, многие гены человека имеют высокую синтению с млекопитающими, от шимпанзе до мышей.
Изучение синтении между организмами может помочь нам определить, как генетические регионы изменяются в процессе эволюции, и имеет далеко идущие применения, включая лучшее понимание эволюции и того, как мы появились, помогая в исследованиях здоровья человека, а также в выращивание лучших культур.
Анил Танки из группы инфраструктуры данных сказал: «Мы очень рады Aequatus, потому что он предоставляет действительно интуитивно понятный способ визуализации гомологичных генов среди видов. геномных данных. Он помогает биологам вникать в детали гомологичных генов, сравнивая их на уровне геномных признаков. Мы также подключили этот ресурс к серверу информации о белковых доменах SMART, чтобы исследователи могли получать нужные данные, не переключая сервисы."
Отмеченные наградами, реальные приложения
Вместе с публикацией инструмента Aequatus в GigaScience главный разработчик Анил Танки из Davey Group в EI был номинирован на награду в призовой категории ICG-13, 13-й Международной конференции по геномике в Шэньчжэне, Китай..
Построенный с использованием технологий с открытым исходным кодом, Aequatus обеспечивает быстрый и интуитивно понятный веб-интерфейс для преодоления разрыва между филогенетическими изменениями и информацией об особенностях генов.
Разработка Aequatus привела к созданию библиотеки JavaScript с открытым исходным кодом - Aequatus.js - которая сохраняет функции приложения полной визуализации, но может быть интегрирована с другими веб-приложениями, такими как чрезвычайно популярный рабочий процесс биоинформатики Galaxy. платформа.
Одним из таких приложений является недавно опубликованный инструмент GeneSeqToFamily, рабочий процесс Galaxy, основанный на конвейере Ensembl Compara GeneTrees для поиска семейств генов. Плагин Aequus был доступен в Galaxy для визуализации результирующих семейств генов, полученных из GeneSeqToFamily.
Новый, более полный инструмент визуализации
В то время как традиционные филогенетические деревья (визуализация общего происхождения в «генеалогическом древе») представляют собой обзор синтении, Aequatus также предоставляет информацию о структурных изменениях в генах, включая их вариации, соответствующие изменениям в фенотипе (внешний вид).
Используя «направляющий» ген в качестве эталона, другие гены сопоставляются на основе выравнивания (анализа сходства последовательностей или того, насколько близко два гена связаны друг с другом на основе их ДНК или белковой последовательности). Выравнивания извлекаются из баз данных с открытым исходным кодом, Ensembl Compara и Ensembl Core, затем Aequtus обрабатывает как сравнительные, так и характеристические данные, чтобы обеспечить визуальное представление филогенетических и структурных изменений между видами на основе общей цветовой схемы.
Типичное дерево генов, визуализированное с помощью инструмента Aequatus.
Это помогает визуализировать области гомологии, а также позволяет идентифицировать изменения в генах, такие как вставки или делеции, с черными полосами, представляющими вставки, специфичные для данного гена, по сравнению с «направляющей».
В целом, Aequatus предоставляет уникальный способ изучения сложных взаимосвязей между генами различных видов на уровне, который до сих пор не был реализован. Применимый не только к высококачественным эталонным геномам, включая мышиные и человеческие, Aequatus был разработан для использования с трудными для сборки или немодельными организмами.
Последняя версия Aequatus также поддерживает REST API Ensembl, который может получать данные непосредственно с сервера Ensembl и не требует использования локальных данных, улучшая переносимость Aequatus.
Роб Дэйви, руководитель группы Data Infrastructure, добавил: «Приятно видеть, что эта работа опубликована и действительно выбрана для награждения на международной конференции. Это показывает, что визуализация геномных данных по-прежнему является активной и ценной областью исследований., и Aequatus действительно может помочь исследователям получить доступ к еще более подробной информации об их генах и интересующих организмах».