Продвижение применения геномных последовательностей через «Kmasker plants»

Продвижение применения геномных последовательностей через «Kmasker plants»
Продвижение применения геномных последовательностей через «Kmasker plants»

Разработка секвенирования следующего поколения (NGS) позволила исследователям исследовать геномы, которые ранее могли считаться слишком сложными или слишком дорогими. Тем не менее, анализ сложных геномов растений, часто содержащих огромное количество повторяющихся последовательностей, все еще остается сложной задачей. Поэтому исследователи в области биоинформатики из Института генетики растений и исследований сельскохозяйственных культур им. Лейбница (IPK), Галле-Виттенбергского университета имени Мартина Лютера (MLU) и Института биохимии растений им. Лейбница (IPB) опубликовали программу «Кмаскер растений», которая позволяет идентифицировать повторяющихся последовательностей и, таким образом, облегчает анализ геномов растений.

В биоинформатике термин k-mer используется для описания нуклеотидной последовательности определенной длины «k». Определяя и подсчитывая такие последовательности, исследователи могут количественно определять повторяющиеся последовательности в изучаемом ими геноме и назначать их на соответствующие позиции. Еще в 2014 году исследователи IPK в Гатерслебене использовали этот подход для разработки встроенного (компьютерного) инструмента «Kmasker». Он был использован для обнаружения повторов в характеристике генома ячменя (Schmutzer et al., 2014).

Использование NGS становится все более и более важным, но безошибочное составление сложных геномов по результатам NGS по-прежнему остается проблемой. По этой причине исследователи недавно решили возродить и расширить этот первоначальный экспериментальный проект. Под руководством доктора Томаса Шмутцера, ранее работавшего в исследовательской группе «Биоинформатика и информационные технологии» в IPK, а теперь связанного с MLU, ученые из MLU, IPK, Wageningen University & Research и IPB Halle работали в тесном сотрудничестве над реконструкция и развитие заводов «Кмаскер»." Это сотрудничество было в значительной степени поддержано двумя сервисными центрами "GCBN" и "CiBi" из Немецкой сети инфраструктуры биоинформатики "de. NBI".

«Kmasker plants» позволяет проводить быстрый и безреференсный скрининг нуклеотидных последовательностей с использованием полногеномных производных k-меров. В дополнение к предыдущей версии инструмент биоинформатики теперь также позволяет проводить сравнительные исследования между различными сортами или близкородственными видами и поддерживает идентификацию последовательностей, подходящих в качестве зондов для флуоресцентной гибридизации in situ (FISH) или CRISPR/Cas9-специфических направляющих РНК. Кроме того, «Kmasker plants» был опубликован с веб-сервисом, который содержит предварительно рассчитанные индексы для отдельных экономически важных сельскохозяйственных культур, таких как ячмень или пшеница. Доктор Шмутцер подчеркивает, что «этот инструмент позволит исследователям растений во всем мире тестировать геномы растений и, таким образом, например, идентифицировать свободные от повторов части интересующей их последовательности. Скорее всего, он полагает, что расширенные признаки позволят обнаружить области-кандидаты последовательности, которые размножились в геноме одного вида, но отсутствуют у других видов или встречаются в меньшем количестве копий. Это общий эффект, который способствует фенотипической изменчивости. имеет агрономическое значение для различных культур. Ярким примером является ген Vrn-H2, который присутствует в единственной копии у озимого ячменя и отсутствует у яровых линий ячменя.

Веб-сервис «Kmasker plants» теперь доступен как часть набора инструментов для анализа культур IPK (CATS) и, следовательно, как сервис сервисной платформы de. NBI. Кроме того, исходный код «Kmasker plants» можно напрямую получить и установить через GitHub.