Один из самых важных вопросов биологии заключается в том, как быстро в организмах образуются новые белки. Белки являются строительными блоками, которые выполняют основные функции жизни. Поскольку гены, которые их производят, изменяются, белки также меняются, привнося новые функциональные возможности или черты, которые в конечном итоге могут привести к эволюции новых видов.
Новое исследование, опубликованное в журнале Nature Ecology and Evolution под руководством ученых из Чикагского университета, ставит под сомнение одно из классических предположений о том, как эволюционируют новые белки. Исследование показывает, что случайные, некодирующие участки ДНК могут быстро эволюционировать для производства новых белков. Эти гены de novo, или «с нуля», обеспечивают новый, неизведанный способ эволюции белков и вносят свой вклад в биоразнообразие.
«Используя большое сравнение геномов, мы показываем, что некодирующие последовательности могут эволюционировать в совершенно новые белки. Это огромное открытие», - сказал Маньюан Лонг, доктор философии, почетный профессор экологии и эволюции Эдны К. Папазян в Чикагском университете. и старший автор нового исследования.
Третий путь эволюции генов
На протяжении десятилетий ученые считали, что есть только два пути эволюции новых генов: дупликация и дивергенция или рекомбинация. Во время нормального процесса репликации и восстановления участок ДНК копируется и создает дублирующую версию гена. Затем одна из этих копий может приобрести мутации, которые изменяют ее функциональность настолько, что она расходится и становится отдельным новым геном. При рекомбинации фрагменты генетического материала перетасовываются для создания новых комбинаций и новых генов. Однако эти два метода учитывают лишь относительно небольшое количество белков, учитывая общее количество возможных комбинаций аминокислот, которые их составляют.
Ученые давно задавались вопросом о третьем механизме, при котором гены de novo могут развиваться с нуля. Все организмы имеют длинные участки генетического материала, которые не кодируют белки, иногда до 97 процентов всего генома. Могут ли эти некодирующие участки приобретать мутации, которые внезапно делают их функциональными?
Это было трудно изучить, потому что для этого требуются высококачественные эталонные геномы нескольких близкородственных видов, которые показывают как предковые, некодирующие последовательности, так и последующие новые гены, которые произошли от них. Без этой четкой, видимой линии эволюции невозможно доказать, что это действительно ген de novo. Предполагаемые новые гены, о которых сообщалось ранее, могли быть просто «геном-сиротой», который в какой-то момент отделился или перешел от неродственных организмов, после чего все следы его предшественников исчезли.
Чтобы решить эти проблемы, команда Лонга воспользовалась преимуществами 13 новых геномов, секвенированных и аннотированных недавно из 11 близкородственных видов растений риса, включая Oryza sativa, наиболее распространенную продовольственную культуру. Он работал с группами, возглавляемыми профессором Родом Вингом в Аризонском университете. Профессор Идан Оуян из сельскохозяйственного университета Хуажонг, Китай, также руководил командой, которая выращивала собственные растения риса на Хайнане, тропическом острове у южного побережья Китая, и собирала их для протеомных исследований.
Проанализировав геномы этих растений, они обнаружили не менее 175 генов de novo. Дальнейший масс-спектрометрический анализ активности белка был проведен другой группой под руководством профессора Сики Лю в BGI-Shenzhen, центре секвенирования генома, расположенном в Шэньчжэне, провинция Гуандун, Китай. Они нашли доказательства того, что 57 процентов этих генов фактически транслируются в новые белки, включая более 300 новых пептидов.
С помощью этого первого большого набора данных подлинных генов de novo команда Лонга обнаружила закономерность в их эволюции. Это началось с ранней эволюции экспрессии, за которой последовала последующая мутация в потенциалы кодирования белка почти для всех генов de novo.
«Это имеет смысл, учитывая широко наблюдаемую экспрессию межгенных областей в различных организмах», - сказал Ли Чжан, исследователь с докторской степенью в Калифорнийском университете в Чикаго и ведущий автор статьи.
Лонг говорит, что растения Oryza являются хорошими геномами для поиска генов de novo, потому что они относительно молоды - вы все еще можете увидеть доказательства эволюции в их существующих геномах.
«11 видов отделились друг от друга всего около трех-четырех миллионов лет назад, поэтому все они являются молодыми видами», - сказал он. «По этой причине, когда мы секвенируем геномы, все последовательности очень похожи. Они не накапливают изменения нескольких поколений, поэтому все предыдущие некодирующие участки все еще существуют».
Лонг и его команда затем хотят изучить новые белки, чтобы лучше понять их функцию и эволюцию и посмотреть, есть ли что-то уникальное в их структуре. Если гены de novo откроют неизведанный путь эволюции, они могут выявить механизмы создания новых и улучшенных клеточных функций. Например, исследователи обнаружили доказательства действия естественного отбора, направленного на исправление вставок и делеций в геноме для создания новых белковых последовательностей, а также эволюции последовательности в сторону улучшения функций.
«Новые белки могут улучшить определенные функции или помочь лучше регулировать гены», - сказал он. «На каждом этапе пути они могут приносить какую-то пользу организму, пока она постепенно не закрепится в геноме».