Что в твоей пшенице? Ученые собрали геном самой распространенной мягкой пшеницы

Что в твоей пшенице? Ученые собрали геном самой распространенной мягкой пшеницы
Что в твоей пшенице? Ученые собрали геном самой распространенной мягкой пшеницы

Ученые Университета Джона Хопкинса сообщают, что они успешно использовали две отдельные генные технологии для сборки наиболее полной на сегодняшний день последовательности генома Triticum aestivum, наиболее распространенного культивируемого вида пшеницы, используемого для приготовления хлеба.

Отчет об этом достижении был опубликован в выпуске GigaScience от 23 октября всего за несколько недель до их связанного отчета о секвенировании «предка» мягкой пшеницы, Aegilops tauschii, опубликованного 15 ноября в Nature.

Вместе, говорят они, последовательности генома пшеницы могут помочь биологам не только лучше понять эволюционную историю пшеницы, но и продвинуть вперед поиски более выносливых, более устойчивых к вредителям и засухе типов пшеницы, чтобы помочь прокормить растущие в мире население.

«После многих лет попыток мы, наконец, смогли произвести высококачественную сборку этого очень сложного генома», - говорит Стивен Зальцберг, доктор философии, заслуженный профессор биомедицинской инженерии Bloomberg в Johns. Инженерная школа Уайтинга Университета Хопкинса и Институт генетической медицины МакКьюсика-Натанса при Медицинской школе Университета Джона Хопкинса.

По словам ученых из Университета Джона Хопкинса, у мягкой пшеницы один из самых сложных геномов, известных науке, содержащий примерно 16 миллиардов пар оснований ДНК и шесть копий семи хромосом. Для сравнения, человеческий геном примерно в пять раз меньше и содержит около трех миллиардов пар оснований и две копии 23 хромосом. Ранее опубликованные версии генома мягкой пшеницы содержали большие пробелы в повторяющейся последовательности ДНК.

«Повторяющийся характер этого генома затрудняет полную секвенирование», - говорит Зальцберг. «Это все равно, что пытаться собрать пазл из пейзажной сцены с огромным голубым небом. Нужно собрать множество очень похожих маленьких кусочков».

Недавно собранный геном мягкой пшеницы, который стоил 300 000 долларов только за секвенирование, исследователям Университета Джона Хопкинса потребовался год, чтобы собрать 1,5 триллиона необработанных данных в окончательную сборку из 15,34 миллиарда пар оснований.

Для этого Зальцберг и его команда использовали два типа технологии секвенирования генома: высокопроизводительное короткое секвенирование и длинное секвенирование одной молекулы. Как следует из названия, высокопроизводительное секвенирование позволяет очень быстро и дешево генерировать огромное количество пар оснований ДНК, хотя фрагменты очень короткие - для этого проекта их длина составляет всего 150 пар оснований. Чтобы помочь собрать повторяющиеся области, команда Джона Хопкинса использовала секвенирование отдельных молекул в режиме реального времени, которое считывает ДНК по мере ее синтеза в крошечной наноразмерной ячейке на чипе. Эта технология позволяет ученым считывать до 20 000 пар оснований за раз, измеряя флуоресцентные сигналы, испускаемые при копировании каждого основания ДНК.

Зальцберг говорит, что секвенирование генома такого размера требует не только генетических знаний, но и очень больших вычислительных ресурсов, доступных в относительно небольшом количестве исследовательских институтов по всему миру. Команда в значительной степени полагалась на Вычислительный центр перспективных исследований Мэриленда, вычислительный центр, совместно используемый Хопкинсом и Мэрилендским университетом, который имеет более 20 000 вычислительных ядер (ЦП) и более 20 петабайт хранилища данных. Команда использовала примерно 100 процессорных лет, чтобы собрать этот геном воедино.

Зальцберг и его команда также участвовали в совместных усилиях, о которых сообщалось в журнале Nature, по секвенированию предкового типа пшеницы, Aegilops tauschii, который обычно называют козьей травой и до сих пор встречается в некоторых частях Азии и Европы. Его геном составляет примерно одну треть размера генома мягкой пшеницы, но имеет такой же уровень повторения. Работа выполнена в рамках совместных усилий Калифорнийского университета в Дэвисе; Джонс Хопкинс; и Университет Джорджии заняло примерно четыре года. Используя секвенирование генома упорядоченного клонирования, секвенирование дробовика и оптическое картирование генома, команда собрала воедино 4,3 миллиарда нуклеотидов, составляющих генетическую последовательность растения. С помощью этой информации остальная часть команды смогла идентифицировать последовательности, составляющие гены, ответственные за определенные характеристики растения.

Другие исследователи, участвовавшие в исследовании хлебной пшеницы, включали Алески В. Зимин и Даниэлу Пуйу, сотрудников лаборатории Зальцберга в Центре вычислительной биологии Института генетической медицины МакКьюсика-Натанса; Сара Кинган и Ричард Холл из Pacific Biosciences в Менло-Парке, Калифорния; и Бернардо Дж. Клавихо из Института Эрлхема в Норвиче, Соединенное Королевство.

Ни один из авторов не сообщает о каких-либо конкурирующих или противоречивых интересах, связанных с исследованием.

Этот выпуск был отредактирован 29 ноября 2017 г., чтобы исправить информацию о технологии секвенирования и сборки, используемой в этом исследовании.