Новый инструмент добывает научные тексты для фактов о гибридных белках: вычислительный подход может помочь усилиям по разработке персонализированных методов лечения рака

Новый инструмент добывает научные тексты для фактов о гибридных белках: вычислительный подход может помочь усилиям по разработке персонализированных методов лечения рака
Новый инструмент добывает научные тексты для фактов о гибридных белках: вычислительный подход может помочь усилиям по разработке персонализированных методов лечения рака

Новый вычислительный инструмент под названием ProtFus просматривает научную литературу, чтобы подтвердить предсказания об активности слитых белков - белков, кодируемых соединением двух генов, которые ранее кодировали два отдельных белка. Сомнат Тагор из лаборатории Френкеля-Моргенштерна в Университете Бар-Илан, Израиль, и его коллеги представляют ProtFus в PLOS Computational Biology.

Различные виды слитых белков могут естественным образом возникать в организме человека, иногда приводя к раку. Понимание взаимодействия между слитыми белками и другими белками может помочь улучшить персонализированное лечение рака. Однако количество научных работ, в которых обсуждаются эти взаимодействия, быстро растет, а стандартного формата представления этой информации не существует. Таким образом, систематизация и отслеживание этих знаний представляет собой серьезную проблему.

ProtFus решает эту проблему, используя вычислительные стратегии, такие как анализ текста и машинное обучение, для анализа научной литературы из онлайн-поисковика PubMed. Он способен идентифицировать слитые белки, которые могут иметь несколько названий, и может идентифицировать экспериментально подтвержденные взаимодействия между слитыми белками и другими белками. Применительно к тестовому набору из 1 817 слитых белков ProtFus выявил 2 908 взаимодействий между 18 типами рака, которые были опубликованы в научных текстах в PubMed.

ProtFus также основывается на инструменте, ранее разработанном исследователями, для прогнозирования взаимодействия данного гибридного белка на основе известных свойств двух его родительских белков. ProtFus берет интересующий слитый белок, использует ранее разработанный инструмент (Chimeric protein-Protein-Interactions или ChiPPI) для предсказания его взаимодействий, а затем проверяет эти взаимодействия с помощью поиска в PubMed.

«Наши результаты демонстрируют потенциал для анализа текста крупных научных статей с использованием новой инфраструктуры больших данных с обновлением в реальном времени статей, публикуемых ежедневно», - говорит д-р Милана Френкель-Моргенштерн, автор-корреспондент изучение. «ProtFus может способствовать изучению изменений белковых сетей у отдельных больных раком в полностью персонализированной манере», - подчеркивает Тагор, первый автор и предыдущий постдоктор в лаборатории (в настоящее время постдоктор в Колумбийском университете, Нью-Йорк).