Машинное обучение помечает новые патогены: новый инструмент машинного обучения может помечать опасные бактерии до того, как они вызовут вспышку, от больничных палат до глобального масштаба

Машинное обучение помечает новые патогены: новый инструмент машинного обучения может помечать опасные бактерии до того, как они вызовут вспышку, от больничных палат до глобального масштаба
Машинное обучение помечает новые патогены: новый инструмент машинного обучения может помечать опасные бактерии до того, как они вызовут вспышку, от больничных палат до глобального масштаба

Разработан новый инструмент машинного обучения, который может определять, вызывают ли новые штаммы бактерии Salmonella опасные инфекции кровотока, а не пищевые отравления. Инструмент, созданный ученым из Института Wellcome Sanger и ее сотрудниками из Университета Отаго, Новая Зеландия, и Института исследований инфекций на основе РНК им. Гельмгольца, расположенного в Центре исследований инфекций Гельмгольца, Германия, процесс выявления генетических изменений, лежащих в основе новых инвазивных типов сальмонелл, представляющих интерес для общественного здравоохранения.

Как сообщили сегодня (8 мая) в PLOS Genetics, инструмент машинного обучения может быть полезен для выявления опасных бактерий до того, как они вызовут вспышку, от больничных палат до глобального масштаба.

Поскольку стоимость геномного секвенирования падает, ученые всего мира используют генетику, чтобы лучше понять бактерии, вызывающие инфекции, как распространяются болезни, как бактерии приобретают устойчивость к лекарствам и какие штаммы бактерий могут вызывать вспышки.

Однако современные методы определения генетической адаптации новых штаммов бактерий, вызвавших вспышку, требуют много времени и часто включают ручное сравнение нового штамма с более старой эталонной коллекцией.

Группа бактерий, известных как Salmonella, включает в себя множество различных типов, которые различаются по тяжести вызываемого ими заболевания. Некоторые типы вызывают пищевое отравление, известное как желудочно-кишечная сальмонелла, в то время как другие вызывают тяжелое заболевание, распространяясь за пределы кишечника, например, сальмонелла тифа, вызывающая брюшной тиф.

Чтобы понять генетические изменения, которые определяют, вызовет ли новый штамм Salmonella enterica пищевое отравление или более серьезную инфекцию, исследователи создали модель машинного обучения, которая анализирует, какие мутации играют важную роль.

Команда обучила модель, используя старые линии сальмонелл, которые эволюционно отличаются друг от друга, включая шесть бактерий сальмонеллы, вызывающих инвазивные инфекции, и семь желудочно-кишечных штаммов бактерий. Модель машинного обучения определила почти 200 генов, участвующих в определении того, вызовет ли бактерия пищевое отравление или лучше адаптируется к инвазивной инфекции.

Д-р Николь Уилер, соавтор из Wellcome Sanger Institute, сказала: «Мы разработали новую модель машинного обучения, которая может определить, какие новые штаммы бактерий могут представлять проблему для общественного здравоохранения. Используя этот инструмент, мы может работать с огромными массивами данных и получать результаты за считанные секунды. В конечном счете, эта работа окажет большое влияние на наблюдение за опасными бактериями так, как мы не могли раньше, не только в больничных палатах, но и в глобальном масштабе."

Применительно к штаммам сальмонелл, которые в настоящее время появляются в странах Африки к югу от Сахары, инструмент правильно выделил два типа из пула широко циркулирующих инфекций (Salmonella Enteritidis и Salmonella Typhimurium), которые являются более опасными и связаны с более высокими показателями случаев инфекции кровотока.

Эти инфекции особенно опасны для людей с ослабленной иммунной системой, таких как ВИЧ-инфицированные. Инструмент машинного обучения выявил генетические изменения, которые позволили штаммам сальмонелл адаптироваться к своим хозяевам и стать более инвазивными.

Д-р Ларс Барквист, соавтор из Института Гельмгольца по исследованию инфекций на основе РНК в Германии, сказал: «Инструмент машинного обучения является шагом вперед по сравнению с другими методами, поскольку он не только ищет гены и мутации, он ищет функциональные последствия, которые мутации оказывают на этих насекомых, и может сказать нам, какие мутации способствуют лучшему распространению патогенов за пределы кишечника и вызывают опасные для жизни заболевания, а не пищевые отравления. Это поможет в разработке более эффективных методов лечения в будущем».

Инструмент машинного обучения, который создает индекс инвазивности на основе модели случайного леса, не ограничивается сальмонеллой и может использоваться для изучения других факторов, таких как возникающая устойчивость к антибиотикам у любой бактерии. Его можно использовать в режиме реального времени для выявления опасного штамма бактерий до того, как он распространится и вызовет вспышку заболевания.

Д-р Николас Физи из Ливерпульской школы тропической медицины сказал: «Мы уже используем этот подход для поиска ключевых различий в штаммах Salmonella Typhi, циркулирующих в Азии, по сравнению с Африкой. Вместо того, чтобы вручную сравнивать геномы разных штаммов бактерий в течение недель или месяцев, мы можем обнаружить генетические изменения, лежащие в основе возникающих штаммов бактерий, за считанные секунды. Это дает возможность изучать вспышки в режиме реального времени и, таким образом, быстро информировать о стратегиях общественного здравоохранения для контроля или предотвращения заболеваний».