Улучшенный метод визуализации данных РНК быстрее позволяет получить более полную картину

Улучшенный метод визуализации данных РНК быстрее позволяет получить более полную картину
Улучшенный метод визуализации данных РНК быстрее позволяет получить более полную картину

Подобно переходу от камеры-обскуры к полароиду, существенное математическое обновление формулы популярного метода визуализации данных в биоинформатике позволит исследователям получать снимки экспрессии генов в одиночных клетках не только в несколько раз быстрее, но и намного быстрее. более высокое разрешение. Опубликованное в журнале Nature Methods, это нововведение математиков из Йельского университета сократит время рендеринга набора данных секвенирования одноклеточной РНК (scRNA-seq) из миллиона точек с более чем трех часов до пятнадцати минут.

Ученые говорят, что существующий десятилетний метод, t-распределенное стохастическое встраивание соседей (t-SNE), отлично подходит для представления паттернов в данных секвенирования РНК, собранных на уровне одной клетки, данных scRNA-seq, в двух измерениях.. «В этих условиях t-SNE «организует» клетки с помощью генов, которые они экспрессируют, и был использован для открытия новых типов клеток и состояний клеток», - сказал Джордж Линдерман, ведущий автор и доктор медицинских наук Йельского университета. студент, специализирующийся на прикладной математике.

По вычислительным стандартам t-SNE довольно медленный. Таким образом, исследователи часто «сокращают выборку» своего набора данных scRNA-seq - берут меньшую выборку из исходной выборки - перед применением t-SNE. Тем не менее, даунсэмплинг - плохой компромисс, так как он делает маловероятным захват t-SNE редких клеточных популяций, которые исследователи чаще всего хотят идентифицировать.

Более 30 лет назад другая группа математиков из Йельского университета разработала метод быстрых мультиполей (FMM), революционный численный метод, ускоривший расчет дальнодействующих сил в задаче n тел. Исследователи этого исследования признали, что принципы, лежащие в основе FMM, также могут быть применены к задачам нелинейного уменьшения размерности, таким как t-SNE, и ускоренному t-SNE, пока он не получил свое новое название: FIt-SNE или t на основе быстрой интерполяции. -СНЭ.

«Используя наш подход, исследователи могут не только быстрее анализировать данные секвенирования РНК отдельных клеток, но также его можно использовать для характеристики субпопуляций редких клеток, которые невозможно обнаружить, если данные подвыборки перед t-SNE», сказал Юваль Клюгер, старший автор и профессор патологии Йельского университета. Кроме того, команда использовала визуализацию в стиле тепловой карты для своих результатов FIt-SNE, что позволяет исследователям легко видеть образцы экспрессии тысяч генов на уровне отдельных клеток одновременно..

Исследователи говорят, что 2019 год не может быть лучшим новым годом для t-SNE, чтобы получить «FIt». В декабре 2018 года журнал Science Magazine назвал отслеживание развития эмбрионов клетка за клеткой, которое невозможно осуществить без визуализации на основе данных scRNA-seq, прорывом года. По словам исследователей, FIt-SNE ускорит дальнейшую работу в этой области биологии развития, а также в таких областях, как неврология и исследования рака, где секвенирование отдельных клеток стало бесценным инструментом для картирования мозга и понимания опухолей.