Исследователи из Европейского института биоинформатики EMBL (EMBL-EBI) создали крупнейший на сегодняшний день эталонный фосфопротеом из почти 120 000 человеческих фосфосайтов. Чтобы определить наиболее важные из них, они использовали подход машинного обучения, способный ранжировать их в соответствии с функциональной важностью.
Белки - это основные молекулярные механизмы клетки, которые можно регулировать с помощью модификаций белков, сродни молекулярным переключателям. Фосфорилирование белка является одним из таких молекулярных переключателей, которые могут изменить структурную конформацию белка, вызывая его активацию, деактивацию или изменение его функции. Несмотря на десятилетия работы, общее количество этих модификаций и какие из них действительно критичны для жизни, остается загадкой.
Это исследование, опубликованное в журнале Nature Biotechnology, представляет собой свободно доступный ресурс, который исследователи могут использовать для лучшего понимания того, какие белки фосфорилируются и какие фосфозиты имеют функциональное значение. Доступ к этим данным имеет большое значение для ускорения исследований многих различных биологических процессов и болезней.
Машинное обучение и обмен данными
«Этот новый ресурс был бы невозможен, если бы ученые всего мира не делились данными и результатами своих исследований», - говорит Педро Бельтрао, руководитель группы EMBL-EBI. «На одной машине потребовалось бы более 500 дней подряд, чтобы запустить все масс-спектрометрические эксперименты, использованные для создания этой базы данных. Применив машинное обучение к этому огромному набору данных, мы создали систему оценки, которая, как мы надеемся, поможет исследователям определить, какие менее известные фосфиты исследовать дальше."
Исследователи EMBL-EBI курировали более 100 общедоступных наборов данных о людях, обогащенных фосфором, содержащих более 6000 масс-спектрометрических экспериментов из базы данных EMBL-EBI PROteomics IDentifications (PRIDE). В рамках этого крупномасштабного проекта была создана крупнейшая на сегодняшний день справочная база данных фосфопротеомов с открытым доступом.
Функциональные фосфозиты человека
Чтобы определить фосфозиты, наиболее важные для клеток человека, было использовано машинное обучение для интеграции различных аннотаций для каждого участка, таких как степень сохранности. Функциональная оценка фосфозита, полученная в этом исследовании, имеет огромный потенциал, чтобы помочь другим ученым узнать больше об интересующих их белках. Его можно использовать для ранжирования известных фосфозитов, чтобы выделить те из них, которые функционально важны для молекулярных процессов и болезней.
Например, исследователи смогли продемонстрировать практичность своей модели функциональной оценки, идентифицировав два фосфозита с высокими показателями, которые играют роль в регуляции дифференцировки нейронов.
«Модель функциональной оценки, созданная на основе этого исследования, может быть использована для выявления большого количества новых функциональных фосфозитов, которые могут играть решающую роль в развитии заболеваний», - говорит Дэвид Очоа, координатор проекта Open Targets. «Мы уже знаем о нескольких группах, которые используют скоринговую модель, поэтому мы хотели бы призвать исследователей во всем мире изучить этот ресурс и использовать его».