Алгоритмы машинного обучения превосходно находят сложные закономерности в больших данных, поэтому исследователи часто используют их для прогнозирования. Исследователи продвигают эту новую технологию за пределы поиска корреляций, чтобы помочь раскрыть скрытые причинно-следственные связи и сделать научные открытия.
В Университете Южной Флориды исследователи интегрируют методы машинного обучения в свою работу по изучению белков. Как они сообщают в The Journal of Chemical Physics от AIP Publishing, одной из их основных проблем было отсутствие методов выявления причинно-следственных связей в данных, полученных в результате моделирования молекулярной динамики.
«Белки можно рассматривать как наноскопические машины, выполняющие ряд задач. Но когда и где белки выполняют свои конкретные задачи, клетки контролируют их с помощью различных стимулов, таких как малые молекулы», - сказал Самир Варма, доцент кафедры биофизики USF. «Эти стимулы взаимодействуют с белками, включая их и выключая, и даже могут изменять их скорость и силу».
В большинстве белков биологические стимулы взаимодействуют с участком белка, который находится относительно далеко от той части, которая выполняет соответствующую задачу, что требует наличия сигнального пути.«Этот способ переключения белков с дистанционным управлением известен как «аллостерическая передача сигналов». В настоящее время идентифицировано много белков, имеющих фармацевтическое значение, в которых динамика или «покачивание и покачивание» составляющих их атомов, как известно, жизненно важны для аллостерической передачи сигналов», - сказал Варма. «Детали, однако, остаются отрывочными».
Варма и его коллеги считают, что подходы машинного обучения могут изменить ситуацию. «Разработка и использование методов машинного обучения позволит нам найти причинно-следственные связи в данных динамики белков и начать, наконец, решать некоторые из очень фундаментальных вопросов аллостерии белков», - сказал он. «Один из наших ключевых выводов заключался в том, что сигнал, инициированный в месте стимуляции белка, по-видимому, ослабевал по мере удаления от места стимуляции. сайты."
Работа группы демонстрирует, как можно использовать подходы машинного обучения для выявления причинно-следственных связей в данных. Помимо этого, «эти методы позволяют нам заполнить критические пробелы в белковой аллостерии», - сказал Варма. «В конечном счете, когда наши методы будут применены ко многим белкам, представляющим фармацевтический интерес, мы ожидаем, что механистические детали откроют столь необходимые новые стратегии вмешательства для восстановления активности белков в болезненных состояниях. решения многих проблем наноинженерии, таких как разработка наносенсоров для адресной доставки лекарств».
Исследователи предвидят новую захватывающую работу, которая станет результатом их недавних открытий. «До сих пор мы сосредоточились на данных о равновесии, но процесс передачи сигналов имеет критический неравновесный компонент, который мы еще не исследовали», - сказал Варма. Группа также планирует более подробно изучить роль окружающих вод в передаче сигналов, а также применить свои методы машинного обучения к широкому набору семейств белков, чтобы определить, в какой степени их новые биофизические результаты можно обобщить.