Убийца ходил по комнате? Только что проплыла акула? Это ядовитый гриб? Какие виды рифов исчезают, когда умирают кораллы? На эти вопросы потенциально можно быстро и дешево ответить, основываясь на крошечных образцах ДНК, найденных в окружающей среде. Но для идентификации ДНК требуется надежная библиотека ранее идентифицированных последовательностей ДНК для сравнения. Смитсоновские ученые и их коллеги проанализировали более 4.7 миллионов последовательностей ДНК животных из GenBank, наиболее часто используемого инструмента для этой цели, и обнаружили, что ошибки идентификации животных встречаются на удивление редко, а иногда и довольно забавно.
«Мы хотели использовать GenBank для идентификации ДНК из образцов океанской воды, поскольку мы оцениваем здоровье коралловых рифов и других морских экосистем, но нас беспокоят сообщения, ставящие под сомнение точность полученных данных», - сказал Матье Лере, постдокторский научный сотрудник Смитсоновского института тропических исследований (STRI). «В наших сравнениях последовательностей мы обнаружили меньше ошибок, чем предсказывали люди, и это очень хорошая новость, потому что программы мониторинга и усилия по сохранению все больше полагаются на анализ ДНК окружающей среды».
Надежность данных в GenBank, виртуальной библиотеке, поддерживаемой Национальным центром биотехнологической информации США при Национальном институте здравоохранения, где генетики хранят последовательности ДНК всех живых существ, в прошлом подвергалась сомнению. Статья под названием «Можете ли вы сделать банк на GenBank?» опубликованный в Trends in Ecology and Evolution в 2003 году, ссылается на исследования, показывающие, что половина последовательностей митохондриальной ДНК человека содержит ошибки и что существуют значительные различия в последовательностях, депонированных для плодовых мушек. В другой статье сообщалось, что 12 из 51 вида очень ядовитого гриба Amanita были идентифицированы неправильно.
«Мы предполагали, что обнаружим много ошибок, когда начали исследование», - сказала Нэнси Ноултон, почетный ученый из STRI и Национального музея естественной истории Смитсоновского института.
«Некоторые люди думают, что GenBank - это просто свалка данных», - сказал Лере. «Никто не проверяет, правильно ли введены данные. Исследователи просто загружают свои данные о последовательности, и им не нужно депонировать образец где-либо конкретно, поэтому, если есть вопрос, может быть нет возможности вернуться к источник, чтобы выяснить, верна ли последовательность. Нам нужно было убедиться, что GenBank является хорошим инструментом для идентификации морских организмов в наших образцах, поэтому мы решили выяснить это."
Вместе с коллегами из Academia Sinica и Университета Джорджа Вашингтона Лерэ и Ноултон оценили долю последовательностей с неправильными названиями рода, семейства, отряда, класса и типа. В целом менее 1 процента последовательностей были неправильно помечены. Они определили определенные группы животных, которые являются особенно проблематичными, и некоторые из потенциальных источников ошибок, таких как неправильная маркировка и заражение от людей, грызунов, лабораторных животных, продуктов питания, комаров и домашних животных, таких как собаки и кошки.
«Например, когда вы вводите данные о последовательности, в какой-то момент появляется раскрывающееся меню, в котором можно выбрать различные виды», - сказал Лерей. «Очевидно, что некоторые люди просто щелкнули не тот вид, тот, который находится выше или ниже названия вида, который они пытались ввести. Эту часть процесса можно исправить, чтобы еще больше снизить количество ошибок».
Прямая идентификация ДНК - это быстрый и недорогой способ ответить на многие вопросы об окружающей среде, а GenBank - надежный инструмент для определения источника ДНК. Авторы пришли к выводу: «Наши обнадеживающие результаты показывают, что быстрое внедрение подходов на основе ДНК поддерживается биоинформационной инфраструктурой, способной оценивать как потери биоразнообразия, вызванные глобальными изменениями, так и эффективность усилий по сохранению, направленных на замедление или обращение вспять этих потерь."