Мониторинг окружающей среды с помощью искусственного интеллекта

Мониторинг окружающей среды с помощью искусственного интеллекта
Мониторинг окружающей среды с помощью искусственного интеллекта

Микроорганизмы выполняют ключевые функции в экосистемах, и их разнообразие отражает здоровье их окружающей среды. Тем не менее, они по-прежнему в значительной степени недостаточно используются в текущих программах биомониторинга, поскольку их трудно идентифицировать. Исследователи из Женевского университета (UNIGE), Швейцария, недавно разработали подход, сочетающий две передовые технологии, чтобы восполнить этот пробел. Они используют геномные инструменты для секвенирования ДНК микроорганизмов в образцах, а затем используют этот значительный объем данных с помощью искусственного интеллекта. Они строят прогностические модели, способные диагностировать состояние экосистем в больших масштабах и выявлять виды, выполняющие важные функции. Этот новый подход, опубликованный в журнале Trends in Microbiology, значительно увеличит возможности наблюдения за крупными экосистемами и сократит время анализа для очень эффективных рутинных программ биомониторинга.

Мониторинг состояния здоровья экосистем имеет решающее значение в контексте устойчивого развития и увеличения нагрузки человека на окружающую среду. Различные виды микроорганизмов, чувствительные к изменениям в окружающей их среде, используются в качестве биоиндикаторов для мониторинга качества окружающей среды. Однако их морфологическая идентификация требует много времени и опыта. «Год назад мы смогли установить индекс качества воды, основанный исключительно на последовательностях ДНК одноклеточных водорослей, присутствующих в образцах, без необходимости визуально идентифицировать каждый вид», - объясняет Ян Павловски, профессор кафедры генетики и эволюции факультет естественных наук UNIGE.

Используйте последовательности ДНК, не идентифицируя их

Геномные инструменты позволяют быстро и очень точно описывать биологические сообщества, населяющие окружающую среду. Однако большая часть данных не может быть использована для диагностики состояния окружающей среды, поскольку многие последовательности ДНК не упоминаются в существующих базах данных. Поэтому виды, обладающие этими последовательностями, неизвестны, как и их экологическая роль. «Чтобы использовать все данные геномики окружающей среды, а именно все биоразнообразие образцов, мы использовали алгоритм машинного обучения», - отмечает Тристан Кордье, член женевской группы и первый автор исследования.

Биологи использовали образцы с разным известным экологическим статусом качества, от хорошего до плохого, из которых они секвенировали ДНК. Комбинация этой информации позволила им построить справочную систему с данными по каждому образцу. «Затем с помощью этого алгоритма была разработана прогностическая модель на основе наших обучающих данных. Сюда входят данные эталонных диагнозов и данные секвенирования неизвестных видов», - говорит Ян Павловски. Эта модель со временем уточняется и проверяется путем включения новых эталонных образцов в существующий набор обучающих данных.

Откройте для себя новые биоиндикаторы

Сочетание этих двух передовых технологий позволяет получать экологические значения последовательностей ДНК без необходимости их идентификации. С помощью этого подхода могут быть обнаружены уже описанные или еще не описанные виды микроорганизмов, выполняющие важные функции, а также новые биоиндикаторы. «Наше исследование имеет некоторое сходство с исследованием микробиома человека. Оба исследования направлены на изучение микробных сообществ и выявление биомаркеров, которые можно использовать в качестве мощных диагностических инструментов для выявления загрязнения окружающей среды или заболеваний человека», - заключает Тристан Кордье.