Глубокое обучение помогает ученым отслеживать внутренние части клетки: разработан алгоритм глубокого обучения, который может отслеживать белки, чтобы помочь выявить, что делает клетки здоровыми, а что

Глубокое обучение помогает ученым отслеживать внутренние части клетки: разработан алгоритм глубокого обучения, который может отслеживать белки, чтобы помочь выявить, что делает клетки здоровыми, а что
Глубокое обучение помогает ученым отслеживать внутренние части клетки: разработан алгоритм глубокого обучения, который может отслеживать белки, чтобы помочь выявить, что делает клетки здоровыми, а что

Исследователи Центра Доннелли разработали алгоритм глубокого обучения, который может отслеживать белки, чтобы помочь выявить, что делает клетки здоровыми, а что не так при заболеваниях.

Мы можем так много узнать, глядя на изображения клеток: как выглядит белок в нормальных условиях и выглядят ли они по-другому в клетках, несущих генетические мутации, или когда мы подвергаем клетки воздействию лекарств или других химических реагентов? Люди пытались вручную оценить, что происходит с их данными, но это занимает много времени», - говорит Бенджамин Грис, аспирант в области молекулярной генетики и соавтор исследования.

Названный DeepLoc, алгоритм может распознавать структуры в клетке, созданные белками, лучше и намного быстрее, чем человеческий глаз или предыдущие подходы, основанные на компьютерном зрении. В статье на обложке последнего выпуска журнала «Молекулярная системная биология» группы под руководством профессоров Бренды Эндрюс и Чарльза Буна из Центра Доннелли и Департамента молекулярной генетики также описывают способность DeepLoc обрабатывать изображения из других лабораторий, иллюстрируя его потенциал для более широкого использования..

От беспилотных автомобилей до компьютеров, которые могут диагностировать рак, искусственный интеллект (ИИ) формирует мир способами, которые трудно предсказать, но для клеточных биологов перемены не могут произойти достаточно скоро. Благодаря новым полностью автоматизированным микроскопам ученые могут собирать огромное количество данных быстрее, чем анализировать их.

«Сейчас на получение изображений клеток уходит от нескольких дней до недель, а на их анализ - от месяцев до лет. Краус, ведущий соавтор статьи и аспирант под совместным руководством Эндрюса и профессора Брендана Фрея из Центра Доннелли и Департамента электротехники и вычислительной техники. Эндрюс, Бун и Фрей также являются старшими научными сотрудниками Канадского института перспективных исследований.

Подобно другим типам ИИ, в которых компьютеры учатся распознавать закономерности в данных, DeepLoc был обучен распознавать разнообразные формы, созданные светящимися белками, помеченными флуоресцентной меткой, которая делает их видимыми, в клетках. Но в отличие от компьютерного зрения, требующего подробных инструкций, DeepLoc учится непосредственно на данных пикселей изображения, что делает его более точным и быстрым.

Грис и Краус обучили DeepLoc на ранее опубликованных данных, которые показывают, что область в клетке занята более чем 4000 дрожжевыми белками - три четверти всех белков в дрожжах. Этот набор данных остается наиболее полной картой, показывающей точное положение подавляющего большинства белков в любой клетке. Когда он был впервые выпущен в 2015 году, анализ был выполнен с помощью сложного конвейера компьютерного зрения и машинного обучения, на выполнение которого ушли месяцы. DeepLoc обработал данные за считанные часы.

DeepLoc смог обнаружить тонкие различия между похожими изображениями. Первоначальный анализ идентифицировал 15 различных классов белков, каждый из которых представляет отдельные районы в клетке; DeepLoc определил 22 класса. Он также смог сортировать клетки, форма которых изменилась из-за гормонального лечения, - задача, которую предыдущий конвейер не мог выполнить.

Грис и Краус смогли быстро переобучить DeepLoc с изображениями, которые отличались от исходного обучающего набора, показав, что его можно использовать для обработки данных из других лабораторий. Они надеются, что другие специалисты в этой области, где взгляд на изображения по-прежнему является нормой, примут их метод.

Кто-то, имеющий некоторый опыт программирования, мог бы реализовать наш метод. Все, что им нужно было бы сделать, это ввести обучающий набор изображений, который мы предоставили, и дополнить его своими собственными данными. Это займет всего час или меньше, чтобы переобучите DeepLoc, а затем начните анализ», - говорит Грис.

Помимо обмена DeepLoc с исследовательским сообществом, Краус работает с Джимми Ба над коммерциализацией метода через новый стартап Phenomic AI. Ба является аспирантом пионера искусственного интеллекта Джеффри Хинтона, бывшего профессора U of T и главного научного консультанта недавно созданного института Vector. Их цель - анализ данных изображений клеток для фармацевтических компаний.

На экране лекарств на основе изображений вы можете фактически выяснить, как лекарства влияют на различные клетки, основываясь на том, как они выглядят, а не на некоторых упрощенных параметрах, таких как живые/мертвые или размер клетки. Таким образом, вы можете извлечь С помощью этих экранов можно получить гораздо больше информации о состоянии клеток. Мы надеемся сделать ранний процесс открытия лекарств еще более точным, находя более тонкие эффекты химических соединений», - говорит Краус.