Использование искусственного интеллекта для исправления ошибок при анализе отдельных клеток

Использование искусственного интеллекта для исправления ошибок при анализе отдельных клеток
Использование искусственного интеллекта для исправления ошибок при анализе отдельных клеток

Провидческий проект огромного масштаба, Атлас клеток человека направлен на картографирование всех тканей человеческого тела в различные моменты времени с целью создания справочной базы данных для разработки персонализированной медицины, т.е. отличать здоровые клетки от больных. Это стало возможным благодаря технологии, известной как секвенирование одноклеточной РНК, которая помогает исследователям точно понять, какие гены включаются или выключаются в любой момент в этих крошечных компонентах жизни. «С методологической точки зрения это огромный скачок вперед. Раньше такие данные можно было получить только из больших групп клеток, потому что для измерений требовалось очень много РНК», - объясняет Марен Бюттнер. «Поэтому результаты всегда были только средними для всех использованных клеток. Теперь мы можем получить точные данные для каждой отдельной клетки», - говорит докторант Института вычислительной биологии (ICB) Helmholtz Zentrum München.

Повышенная чувствительность метода, однако, также означает повышенную подверженность пакетному эффекту. «Пакетный эффект описывает колебания между измерениями, которые могут возникнуть, например, если температура устройства отклоняется даже незначительно или изменяется время обработки клеток», - объясняет Марен Бюттнер. Хотя существует несколько моделей коррекции этих отклонений, эти методы сильно зависят от фактической величины эффекта. «Поэтому мы разработали удобную, надежную и чувствительную меру под названием kBET, которая количественно определяет различия между экспериментами и, следовательно, облегчает сравнение различных результатов коррекции», - говорит Бюттнер.

Помимо эффекта партии, явление, известное как события выпадения, представляет серьезную проблему при секвенировании отдельных клеток. «Допустим, мы секвенируем клетку и наблюдаем, что конкретный ген в клетке вообще не излучает никакого сигнала», - объясняет д-р доктор Фабиан Тейс, директор ICB и профессор математического моделирования биологических систем в ТУМ. «Основная причина этого может быть биологической или технической по своей природе: либо ген не считывается секвенсором, потому что он просто не экспрессируется, либо он не был обнаружен по техническим причинам», - объясняет он.

Чтобы распознать эти случаи, биоинформатики Гексен Эраслан и Лукас Симон из группы Тейса использовали большое количество последовательностей многих отдельных клеток и разработали так называемый алгоритм глубокого обучения, то есть искусственный интеллект, который имитирует процессы обучения, происходящие в люди (нейронные сети).

Опираясь на новую вероятностную модель и сравнивая исходные и реконструированные данные, алгоритм определяет, связано ли отсутствие генного сигнала с биологической или технической ошибкой.«Эта модель даже позволяет определять поправки для конкретных типов клеток без искусственного сходства двух разных типов клеток», - говорит Фабиан Тейс. «Как один из первых методов глубокого обучения в области геномики отдельных клеток, этот алгоритм имеет дополнительное преимущество, заключающееся в том, что он хорошо масштабируется для обработки наборов данных, содержащих миллионы клеток».

Но есть одна вещь, которой метод не является? и это важно подчеркнуть: «Мы не разрабатываем программное обеспечение для сглаживания результатов. Наша главная цель - выявить и исправить ошибки», - объясняет Фабиан Тейс. «Мы можем поделиться этими максимально точными данными с нашими коллегами по всему миру и сравнить наши результаты с их результатами», - например, когда исследователи Гельмгольца вносят свои алгоритмы и анализы в Атлас клеток человека, потому что надежность и сопоставимость данных имеет первостепенное значение.