Новый алгоритм позволяет интегрировать данные с разрешением одной ячейки

Новый алгоритм позволяет интегрировать данные с разрешением одной ячейки
Новый алгоритм позволяет интегрировать данные с разрешением одной ячейки

Команда вычислительных биологов разработала алгоритм, который может «выравнивать» несколько наборов данных секвенирования с разрешением одной клетки. Новый метод, опубликованный сегодня в журнале Nature Biotechnology, имеет значение для лучшего понимания того, как различные группы клеток изменяются во время прогрессирования заболевания, в ответ на медикаментозное лечение или в процессе эволюции.

«Этот подход к интеграции данных позволит сравнивать наборы данных по отдельным клеткам и анализировать различия между ними», - объясняет Рахул Сатиджа, старший автор исследования, доцент Центра геномики Нью-Йоркского университета. и системной биологии, а также ведущий преподаватель Нью-Йоркского центра генома.«Более того, эти методы будут полезны для интеграции разнообразных наборов данных, полученных от отдельных лиц и лабораторий, и даже для исследователей, изучающих одну и ту же ткань у разных видов».

Область секвенирования отдельных клеток быстро расширяется, что позволяет точно изучить, как основные строительные блоки жизни функционируют и развиваются. Однако остаются значительные вычислительные проблемы, особенно при анализе нескольких наборов данных. Например, когда команда независимо проанализировала наборы данных одних и тех же стволовых клеток костного мозга, полученных в двух разных лабораториях, они получили поразительно разные результаты.

«Нам нужен был новый метод, который мог бы идентифицировать и выравнивать общие группы клеток, присутствующих в нескольких экспериментах, чтобы мы могли интегрировать наборы данных вместе», - говорит Эндрю Батлер, аспирант Нью-Йоркского университета и ведущий автор исследования.

Для этого исследователи модифицировали аналитические методы, специализирующиеся на поиске общих закономерностей на изображениях, например, чтобы выровнять изображения лиц в разных условиях освещения для данных секвенирования отдельных клеток. Когда они повторили анализ костного мозга, постоянно появлялись одни и те же клеточные популяции.

«Мы поняли, что можем использовать эти методы, чтобы узнать, как клетки изменяют свое поведение - например, в ответ на медикаментозное лечение», - отмечает Батлер.

Проанализировав набор данных иммунных клеток человека, стимулированных интерфероном - сигнальным белком, созданным в ответ на патогены или опухолевые клетки, - команда смогла точно определить, какие гены были включены в каждом из 13 реагирующих типов клеток. Кроме того, они объединили наборы данных по отдельным клеткам ткани поджелудочной железы человека и мышей, тем самым идентифицировав 10 типов клеток, общих для разных видов, и определив эволюционные изменения, происходящие в каждой группе.

Заглядывая вперед, исследователи применяют свой подход к изучению клеточной реакции на лекарства в клинических образцах, но также стремятся сделать свои методы широко доступными.

«Все наше программное обеспечение имеет открытый исходный код и находится в свободном доступе в Интернете», - добавляет Сатия. «Мы надеемся, что эти методы помогут другим членам сообщества открыть для себя новые захватывающие биологические явления».

Работа была поддержана грантами Национальных институтов здравоохранения (Премия нового новатора 1DP2HG009623-01, 5R01MH071679-12) и стипендией Национального научного фонда для выпускников (DGE1342536).