Машинное обучение помогает науке о растениях открыть новую страницу: ученые используют алгоритмы машинного обучения для автоматизации исследований растений

Машинное обучение помогает науке о растениях открыть новую страницу: ученые используют алгоритмы машинного обучения для автоматизации исследований растений
Машинное обучение помогает науке о растениях открыть новую страницу: ученые используют алгоритмы машинного обучения для автоматизации исследований растений

Отец генетики Грегор Мендель провел годы, утомительно наблюдая и измеряя признаки растений гороха вручную в 1800-х годах, чтобы раскрыть основы генетической наследственности. Сегодня ботаники могут намного быстрее отслеживать признаки или фенотипы сотен или тысяч растений с помощью автоматизированных систем камер. Теперь исследователи Солка помогли еще больше ускорить фенотипирование растений с помощью алгоритмов машинного обучения, которые обучают компьютерную систему анализировать трехмерные формы ветвей и листьев растения. Исследование, опубликованное в журнале Plant Physiology 7 октября 2019 года, может помочь ученым лучше определить, как растения реагируют на изменение климата, генетические мутации или другие факторы.

«Мы разработали набор инструментов, которые помогают решать некоторые распространенные проблемы фенотипирования», - говорит Сакет Навлаха, доцент Лаборатории интегративной биологии Солка и председатель Фонда развития пионеров.

Среда, в которой растет растение, определяет его структуру, которая связана с его здоровьем. Ученые, пытающиеся понять рост растений, создать более устойчивые растения или повысить урожайность, часто хотят измерить подробные характеристики листьев и побегов растения. Для высокопроизводительного фенотипирования многие исследователи используют системы камер, которые делают снимки каждого растения под разными углами и собирают трехмерную модель. Тем не менее, некоторые измерения с этими сшитыми вместе изображениями провести сложно.

Недавно некоторые обратились к новому методу, называемому трехмерным лазерным сканированием, для захвата структуры архитектуры растений. Исследователи светят лазером на каждое растение, чтобы «окрасить» лучом его поверхность. Полученные данные, называемые трехмерным облаком точек, отображают мелкие детали поверхности растения. Но количественный анализ облаков точек может оказаться сложной задачей, поскольку технология очень новая, а наборы данных такие большие.

«Разрешение и точность этих данных намного выше», - говорит Навлаха. «Но методы, которые были разработаны для анализа листьев и ветвей на 2D-изображениях, не работают для этих 3D-облаков точек».

Навлаха вместе с аспирантом Калифорнийского университета в Сан-Диего Ильей Зямцовым использовали лазерный 3D-сканер для сканирования 54 растений помидоров и табака, выращенных в различных условиях. Затем они ввели полученные трехмерные облака точек в алгоритмы машинного обучения, которые позволили им научить программу фенотипированию растений. Техника заключалась в том, что исследователи сначала вручную указывали, где находятся листья и побеги на растениях. Затем программное обеспечение начало автоматически распознавать эти функции.

«Это как учить чему-то ребенка», - говорит Навлаха. «Вы даете им примеры того, как выглядит лист и как выглядит ветка, и, в конце концов, они могут определить растение, которое никогда раньше не видели, и выбрать листья и ветки».

Исследователи сосредоточились на том, чтобы научить программу делать три измерения фенотипа, которые часто используют ученые: отделять стебли от листьев, подсчитывать листья и их размер и намечать схемы ветвления растения. Они оказались успешными: например, метод имел точность 97,8% при идентификации стеблей и листьев.

«Этот вид обнаружения объектов использовался в беспилотных автомобилях и для идентификации строительных и мебельных предметов», - говорит Зямцов. «Но применять его к растениям - совершенно новое дело».

Навлаха и Зямцов хотят продолжить доработку подхода; например, различение двух близко расположенных листьев все еще может быть сложной задачей. И текущая версия ПО может работать не на всех типах растений. Они надеются обобщить программное обеспечение для работы с растениями от лиан до деревьев, а также для анализа корней.

«Сейчас в сельском хозяйстве стоит много задач, чтобы попытаться увеличить урожайность и лучше улавливать углерод», - говорит Навлаха. «Мы надеемся, что наш инструмент поможет биологам решить некоторые из этих более широких проблем».

Навлаха и Зямцов выпустят свое программное обеспечение с открытым исходным кодом для использования другими исследователями. Они надеются, что программное обеспечение ускорит исследования растений, поскольку оно сделает высокопроизводительное фенотипирование быстрее и проще.

«Проводить такой анализ вручную очень трудоемко, - говорит Зямцов. «Наш инструмент делает это быстро и довольно точно».

Работа была поддержана грантами благотворительного фонда Pew Charitable Trusts, Национального научного фонда и Национального института здоровья.