Объединение ресурсов данных о путях дает более четкое представление о сложных биологических взаимодействиях

Объединение ресурсов данных о путях дает более четкое представление о сложных биологических взаимодействиях
Объединение ресурсов данных о путях дает более четкое представление о сложных биологических взаимодействиях

Объединяя мощность 27 источников данных, Omnipath помогает исследователям с беспрецедентной точностью видеть биологические сигнальные пути. Разработанный исследователями из Великобритании и Германии и опубликованный в журнале Nature Methods, OmniPath предлагает всеобъемлющую унифицированную коллекцию сигнальных путей, проверенных в литературе, на основе анализа 41 000 научных статей.

Все функции, происходящие в наших клетках, контролируются группами молекул, работающих вместе через сигнальные пути. Как только первая молекула получает сигнал, активируется следующая и так далее. Когда в этих путях что-то идет не так, может развиться рак. Многие лекарства от рака работают, создавая препятствия на пути, останавливая сигнал и, возможно, рост раковой ткани.

Чтобы выяснить, как работают сигнальные пути, молекулярные биологи проводят и подтверждают эксперименты, иногда в течение многих лет, чтобы охарактеризовать точные взаимодействия, происходящие между белками.

Исследователи могут делиться результатами этих исследований в общедоступных базах данных, чтобы коллективно накапливать знания. Данные объединены с результатами тысяч опубликованных исследований молекулярных взаимодействий. Они организованы опытными «кураторами», поэтому их можно обнаружить, и они могут помочь исследователям в проведении новых экспериментов или анализе новых результатов.

В настоящее время существует более 27 общедоступных баз данных по сигнальным взаимодействиям, каждая из которых предлагает что-то свое, а многие из них предлагают настраиваемые форматы. OmniPath, разработанный исследователями из EMBL-EBI, Рейнско-Вестфальского технического университета Ахена и Института Эрлхэма, дает единое представление обо всех «отобранных из литературы» сигнальных взаимодействиях в этих базах данных.

На момент запуска OmniPath содержит ссылки на более чем 41 000 оригинальных исследований с данными, представляющими 36 557 взаимодействий между 7 984 белками. Интерактом, описывающий все биологические взаимодействия в организме, может включать от 100 000 до 250 000 взаимодействий у человека. Это огромный объем информации, которую нужно собрать воедино, поэтому точность и последовательность имеют первостепенное значение.

«Работа кураторов данных бесценна, потому что без них данные никогда не будут собраны с той точностью, которая вам нужна в биологии», - говорит Денес Тюрей, научный сотрудник EIPOD в EMBL-EBI. «Было интересно работать вместе с людьми из столь многих дисциплин и создавать этот краткий взгляд на коллективные современные знания о сигнальных путях."

«Исследователи склонны доверять точности отобранных ресурсов, не вникая слишком глубоко в их фактическое содержание и методы», - говорит Тамаш Корчмарош, научный сотрудник Института Эрлхема и Института пищевых исследований. «Бенчмаркинговые исследования в основном были сосредоточены на ресурсах с взаимодействиями из экспериментов с высокой пропускной способностью, и даже их было немного и далеко друг от друга».

Новое исследование содержит исчерпывающие рекомендации, основанные на тщательном изучении более 50 источников данных, чтобы помочь исследователям выбрать наиболее подходящий источник данных для своей работы.

Данные в OmniPath в основном основаны на небольших экспериментах, но его программное обеспечение Pypath позволяет добавлять наборы данных, полученные в результате крупных экспериментов по скринингу или преобразованные из реакций. Pypath (модуль Python) позволяет пользователям создавать собственные сигнальные сети и объединять их с другими данными. Это мощный инструмент для включения путей в рабочие процессы биоинформатики, который делает анализ OmniPath полностью открытым, прозрачным и легко воспроизводимым.

«Мы сравнили все виды ресурсов сигнальных данных и выяснили свойства различных наборов данных, что помогает исследователям принимать более обоснованные решения в ходе анализа», - говорит Хулио Саес-Родригес, руководитель группы в EMBL-EBI и профессор. в RWTH Ахен. «Он уже оказался очень ценным для исследований в наших группах, и мы надеемся, что другие тоже сочтут его ценным».