История нашего климата написана льдом. Чтобы прочесть его, нужно расшифровать сложные сигналы, извлеченные из накопленных за десятки тысяч лет изотопов, замороженных в милях под поверхностью Антарктиды..
Разбираясь в огромном количестве информации, заключенной в ледяном керне, ученые сталкиваются с криминалистической проблемой: как лучше всего отделить полезную информацию от искаженной.
Новая статья, опубликованная в журнале Entropy, показывает, как инструменты теории информации, отрасли науки о сложности, могут решить эту проблему, быстро находя части данных, которые требуют дальнейшего изучения.
«С такими данными у нас ограниченные возможности сделать это правильно», - говорит Джошуа Гарланд, математик из Института Санта-Фе, который работает с данными за 68 000 лет из Западно-Антарктического ледяного щита. Основной. «Для извлечения льда и обработки данных требуются сотни людей, а также тонны обработки и анализа.
К тому времени, когда Гарланд и его команда получили данные, прошло более 10 лет от первоначального бурения ледяного керна до публикации содержащегося в нем набора данных. Двухмильный ледяной керн был извлечен в течение пяти сезонов с 2007 по 2012 год командами из нескольких университетов, финансируемых Национальным научным фондом. Из полевого лагеря в Западной Антарктиде керн был упакован, затем отправлен в Центр ледяных кернов Национального научного фонда в Колорадо и, наконец, в Колорадский университет. В Лаборатории стабильных изотопов Института арктических и альпийских исследований современное оборудование для обработки данных помогло ученым извлечь записи изотопов воды изо льда.
В результате получается сложный набор данных с высоким разрешением. По сравнению с предыдущими данными ледяных кернов, которые позволяли анализировать каждые 5 сантиметров, керн WAIS Divide позволяет проводить анализ с миллиметровым разрешением.
«Одна из замечательных особенностей исследования ледяных кернов за последнее десятилетие заключается в том, что мы разработали эти лабораторные системы для анализа льда в высоком разрешении», - говорит Тайлер Джонс, палеоклиматолог из Университета Колорадо в Боулдере. «Некоторое время назад мы были ограничены в наших возможностях анализа климата, потому что не могли получить достаточно точек данных, а если бы и могли, то это заняло бы слишком много времени. Эти новые методы дали нам миллионы точек данных, которые довольно сложно обработать. управлять и интерпретировать без каких-либо новых достижений в нашей обработке [данных]."
В предыдущих ядрах Гарланд отмечает, что десятилетия и даже столетия были объединены в одну точку. Данные WAIS, напротив, иногда дают более сорока точек данных в год. Но по мере того, как ученые переходят к анализу данных в более коротких временных масштабах, даже небольшие аномалии могут быть проблематичными.
«По мере поступления детальных данных можно проводить детальный анализ», - отмечает Гарланд. «Но это также делает анализ восприимчивым к мелкозернистым аномалиям».
Чтобы быстро определить, какие аномалии требуют дальнейшего изучения, команда использует методы теории информации для измерения степени сложности, возникающей в каждой точке временной последовательности. Внезапный всплеск сложности может означать, что произошло крупное неожиданное климатическое событие, такое как извержение супервулкана, или возникла проблема с данными или конвейером обработки данных.
«Такого рода аномалии были бы невидимы без очень подробного, мелкозернистого, точечного анализа данных, на выполнение которого эксперту-человеку ушло бы много месяцев», - говорит Элизабет Брэдли, компьютерщик. ученый из Университета Колорадо в Боулдере и внештатный профессор Института Санта-Фе.«Хотя теория информации не может сказать нам основную причину аномалии, мы можем использовать эти методы, чтобы быстро пометить сегменты набора данных, которые должны быть исследованы экспертами по палеоклимату».
Она сравнивает набор данных Ice Core с поиском Google, который возвращает миллион страниц. «Дело не в том, что вы не могли просмотреть эти миллионы страниц, - говорит Брэдли. «Но представьте, если бы у вас была техника, которая могла бы направить вас к потенциально значимым?» При анализе больших наборов данных реального мира теория информации может обнаружить различия в данных, которые сигнализируют либо об ошибке обработки, либо о значительном климатическом событии.
В своей статье об энтропии ученые подробно описывают, как они использовали теорию информации для выявления и восстановления проблемного участка данных из исходного ледяного керна. Их исследование в конечном итоге привело к повторной выборке архивного ледяного керна - самой длинной повторной выборке ледяного керна с высоким разрешением на сегодняшний день. Когда эта часть льда была повторно отобрана и обработана, команда смогла обнаружить аномальный всплеск энтропии примерно 5000 лет назад.
«Жизненно важно правильно определить эту область, - отмечает Гарланд, - потому что она содержит информацию о климате на заре человеческой цивилизации».
«Я думаю, что изменение климата - самая насущная проблема, с которой когда-либо сталкивалось человечество, и ледяные керны, несомненно, являются лучшим свидетельством климата Земли за сотни тысяч лет», - говорит Джонс. «Теория информации помогает нам просеивать данные, чтобы убедиться, что то, что мы выпускаем в мир, является самым лучшим и самым надежным продуктом, который мы можем».