Новая общедоступная база данных будет каталогизировать метаданные, связанные с биологическими образцами, что облегчит исследователям обмен и повторное использование генетических данных для экологического анализа.
Ресурс под названием База метаданных геномных обсерваторий (GeOMe) был разработан исследователями из Смитсоновского национального музея естественной истории и восьми других музеев и исследовательских институтов. Он связывает общедоступные генетические данные с записями о том, где и когда были собраны образцы, предоставляя контекстуальную информацию, которая до сих пор отсутствовала в общедоступных базах данных. Такая информация имеет решающее значение для сравнения биоразнообразия в различных местах по всему миру и отслеживания его во времени. Но, несмотря на призывы к большему обмену данными в исследовательском сообществе, исследователям до сих пор не хватало инструментов, чтобы сделать эту информацию легко доступной.
Разработчики базы данных, описанной 3 августа в журнале PLOS Biology, заявили, что стандартизация и сохранение этих метаданных значительно повысит ценность данных о генетических последовательностях, которые исследователи уже собирают. С помощью GeOMe исследователи смогут находить и получать доступ к генетическим данным, собранным в определенное время и в любом месте в любой точке мира, что позволит им задавать важные вопросы о структуре и устойчивости жизни на планете. Например, они могут исследовать, как жители определенной высоты по всему миру изменились по мере изменения климата планеты.
«Отслеживание биоразнообразия через глобальные изменения - это совместная работа», - сказал Кристофер Мейер, зоолог-исследователь из Национального музея естественной истории, который помогал руководить разработкой GeOMe. «Мы не можем сделать это самостоятельно. GeOMe будет продвигать большие данные и открытия для будущего, позволяя сумме научных усилий намного превосходить отдельные исследовательские продукты».
Ученые, которые анализируют экологические образцы, будь то растения, животные или целые сообщества микробов, собранные из океанов, пресной воды или суши, имеют свои собственные системы для отслеживания того, когда эти образцы были собраны. Но для более широкого исследовательского сообщества такую информацию было трудно получить и невозможно провести всесторонний поиск. GeOMe предлагает решение, постоянно связывая информацию о временном, экологическом, геопространственном и научном контексте образцов с данными о генетических последовательностях, хранящимися в Национальном центре биотехнологической информации.
Мейер сказал, что он и его коллеги посвятили время и ресурсы разработке GeOMe, потому что они знали, что это будет мощный инструмент для ускорения открытий. Как музейщики, они признают ценность отслеживания и сохранения информации. И как лидеру в приобретении и распространении знаний о биоразнообразии, по словам Мейер, важно, чтобы Национальный музей естественной истории играл ключевую роль.
GeOMe, в том числе Эрик Крэндалл из Калифорнийского государственного университета в Монтерей-Бей, Мишель Гейтер из Гавайского института морской биологии и Джон Дек из Музеев естественной истории Беркли, работали над тем, чтобы этот ресурс было легко найти. использовать и адаптировать для широкого круга потребностей. По их словам, поскольку база данных и набор инструментов находятся в свободном доступе для исследовательского сообщества, научные журналы теперь могут требовать, чтобы авторы предоставляли свои метаданные в доступном для поиска и стандартизированном формате, как они уже давно сделали для данных о генетических последовательностях.
Важно, отмечает команда, данные в GeOMe будут соответствовать стандартам, разработанным Консорциумом геномных стандартов и организацией по стандартам информации о биоразнообразии, гарантируя, что отправители собирают и записывают одну и ту же важную информацию о каждом образце. Эти стандарты гарантируют, что в будущем исследователи смогут проводить анализ наборов данных.
«[Наши знания] о биоразнообразии записываются с помощью геномных данных, но эти данные мало что значат, если вы не можете поместить их в контекст», - сказал Мейер. «Если мы не начнем внедрять подобный инструмент сейчас, наши данные навсегда останутся бесполезными».