Исследователи из Helmholtz Zentrum München разработали новый метод реконструкции непрерывных биологических процессов, таких как прогрессирование заболевания, с использованием данных изображений. Исследование было опубликовано в журнале Nature Communications.
Современные науки о жизни генерируют постоянно растущий объем данных за все более короткие циклы. Сделать такие данные контролируемыми и пригодными для оценки - задача доктора Александра Вольфа и его коллег из Института вычислительной биологии Helmholtz Zentrum München (ICB). Имея это в виду, исследователи пытаются разработать программное обеспечение, которое обрабатывает эту оценку. Но, конечно, есть различные препятствия, которые нужно преодолеть.
«В текущем исследовании мы рассмотрели проблему, заключающуюся в том, что программное обеспечение не может назначать данные изображения непрерывным процессам», - объясняет руководитель исследования Вольф. «Например, можно классифицировать информацию об изображении в соответствии с четко определенными категориями, но в развитии болезни и биологии развития пределы быстро достигаются, потому что процессы являются непрерывными, а не отдельными шагами».
Чтобы принять это во внимание, команда Гельмгольца использовала методы так называемого глубокого обучения (то есть процессов машинного обучения). «Используя искусственные нейронные сети, мы теперь можем объединять отдельные изображения в процессы и дополнительно отображать их так, как их понимают люди», - говорят Филипп Эйленберг и Никлас Келер, бывшие студенты магистратуры ICB и первые авторы исследования.
Клетки крови и сетчатка как спарринг-партнеры
Чтобы продемонстрировать возможности метода, ученые выбрали два примера. В первом подходе программное обеспечение реконструировало непрерывный клеточный цикл лейкоцитов, используя изображения с проточного цитометра (с получением изображений во флуоресцентном микроскопе). «Еще одним преимуществом этого исследования является то, что наше программное обеспечение настолько быстрое, что можно извлечь данные о развитии клеток «на лету», то есть во время анализа в цитометре», - объясняет Вольф. «Кроме того, наше программное обеспечение делает в шесть раз меньше ошибок, чем предыдущие подходы».
Во втором эксперименте исследователи реконструировали развитие диабетической ретинопатии. «Мы сделали это, загрузив в наше программное обеспечение 30 000 отдельных изображений сетчатки в качестве, так сказать, спарринг-партнеров», - объясняет Никлас Келер. «Поскольку оно автоматически компилирует эти данные в непрерывный процесс, программное обеспечение позволяет нам прогнозировать прогрессирование заболевания в непрерывном масштабе."
А если данные не являются частью непрерывного биологического процесса? «В таком случае программное обеспечение распознает, что задействованы отдельные категории, и присваивает измеренные данные отдельным кластерам», - объясняет Вольф. Помимо дальнейшего применения метода, в будущем Вольф и его коллеги хотят решить другие задачи, связанные с оценкой биологических данных с помощью машинного обучения.