О длине генов

Ещё давно-давно, три года назад, когда начинали пилить Open Genes, мы с Костей Рафиковым обсуждали, что должны как можно больше физических характеристик записать в базу. Вдруг увидим какие-то интересные совпадения у генов, ассоциированных со старением и долголетием? Итак, что мы знаем о размерах генов?

Генетика

Более эволюционно консервативные гены часто длиннее. У них также часто бОльшая интронная нагрузку, то есть большее число некодирующих белок фрагментов гена — интронов. Интроны, как нам рассказал Евгений Кунин, появились в ДНК наших древних предков после симбиоза с митохондриями. От митохондрий новая клетка, кроме прочего, получила и бактериальные транспозоны. Которые стали встраиваться в геном клетки и превращаться в некодирующие вставки — интроны. Так получился альтернативный сплайсинг, и с одного гена теперь считается гораздо больше белков. Точнее, протеоформ. Один ген — один белок, а вот форм несколько, протеоформ. Их обычно выделяют трёх видов:
  1. продукты альтернативного сплайсинга;
  2. протеоформы, содержащие полиморфизмы одиночных аминокислот (single amino-acid polymorphisms (SAPs)), возникающие из несинонимичных однонуклеотидных полиморфизмов (nsSNP);
  3. те, которые подвергаются посттрансляционным модификациям.

В 2016 году биохимики из ИБМХ РАН насчитали1 больше 6 миллионов протеоформ. А генов-то 19 (21,5?) тысяч. Понимаете теперь, какой важный процесс — альтернативный сплайсинг и насколько интересный такой параметр, как длинна гена? Кстати, есть белки, которые трудно или даже невозможно обнаружить. В мембранах много трудно растворимых белков. А ещё много генов, для которых невозможно поймать транскрипты, потому что у некоторых участков хромосом недоступный хроматин: если уровень экспрессии транскриптов слишком низок для чувствительности современных инструментов, масс-спектрометрия их не увидит. Ещё есть пептиды (короткие белки) и на 2022 год их насчитали 2 954 162. Причём пептидная регуляция — самый топ в старении, требующая невероятного объема исследований, как, впрочем, и всё остальное. По версии Кунина, благодаря слиянию с митохондриями у прокариот появилось и ядро, разделение транскрипции (в ядре) от трансляции (в цитозоле клетки). Но это отдельная история. При этом длина гена — вещь непостоянная. Ген становится длиннее по ходу эволюции, частично из-за вставок мобильных элементов. А вот после дупликации ген может оказаться короче. Дупликация — это когда раз, и появляется вторая копия гена из-за разных там хромосомных дел. Таким образом, длина генов коррелирует как с дупликацией генов, так и с альтернативным сплайсингом: более длинные гены с меньшей вероятностью будут производить дубликаты и с большей — демонстрировать альтернативный сплайсинг. Эволюционная линия, ведущая к многоклеточным животным, отмечена ростом сложности организма, выразившемся в развитии клеточных компонентов и появлении новых типов клеток. Ну и старение — оно тесно связано именно с многоклеточностью. Так-то прокариоты старение победили и два миллиарда лет обходились без него (репликативное не считается). Такое усложнение живого должно происходить на фоне геномных изменений. И механизмы дупликации генов и альтернативного сплайсинга играют здесь главную роль. Оба эти источника эволюционной новизны допускают появление функций, не затрагивая ранее существовавшие. Таким образом, могут способствовать возникновению вариаций, необходимых для роста сложности. Более экзотические способы инноваций, такие как фактическое происхождение генов, кодирующих белок, из некодирующих белок последовательностей, также могут способствовать эволюции генома. Но, как считается, их вклад вряд ли будет сопоставим с вкладом дупликации генов. Кроме того, потеря генов, которая выступает неотъемлемым аспектом эволюционного процесса и была обширной в некоторых линиях, также может вызывать появление новых генов. Иногда ген, присутствующий в определенной линии, кажется новым, потому что его гомологи в других линиях были потеряны в ходе эволюции. При этом процессы появления и потери гена неразрывно связаны, поскольку оба, как правило, происходят в период эволюционного «свободного падения», когда ген свободен от ограничений очищающего отбора. Ещё одна взаимосвязь с размером гена — уровень его экспрессии.2 Самая высокая экспрессия характерна для коротких генов. Гены с высокой экспрессией будут продуцировать более короткие белки, что снизит затраты организма на трансляцию. Положительный отбор не мог пройти мимо такого шанса получить эволюционное преимущество. Почему же тогда сохраняются длинные гены, синтезировать с которых белок организму дольше и труднее? Например, ген длиной 100 пар оснований потребует всего несколько секунд для завершения элонгации транскрипции, в то время как у гена длиной 2 миллиона пар оснований это займет целые сутки. Одна из возможных причин такого разнообразия размеров генов — возможность устраивать сигнальные каскады, поочередно синтезируя белки из генов разной длины. То есть чтобы нужные белки появлялись в ответ на какой-то стимул не все сразу, а с очерёдностью, заданной длиной генов. То есть такая эшелонированная реакция. Тот же стресс-ответ так устроен. Статья об этом Mats Ljungman с коллегами так и называется: Длина гена как биологический таймер для установления временной регуляции транскрипции.3 Ещё одна возможная причина сохранения длинных генов в процессе эволюции: альтернативный сплайсинг, характерный для длинных генов, позволяет расширить белковое разнообразие. Тут вообще возникает фантастически интересный вопрос: а почему вообще сложность в ходе эволюции нарастает? Почему бы человеку обратно в бактерию не превратиться? Так сложно всё в этой жизни. Как описал в своей работе 2021 г. Joao Pedro de Magalhaes,4 главный человек в системной биологии старения, длинные гены в основном экспрессируются в кровеносных сосудах, щитовидной железе, головном мозге и нервной ткани. Тогда как самые маленькие, как правило, — в поджелудочной железе, коже, желудке, влагалище и яичках. Естественный отбор подавляет изменения для генов с более длинными транскриптами и способствует изменениям для генов с меньшими транскриптами. Также авторы наблюдали, что гены с более длинными транскриптами, как правило, имеют большее количество коэкспрессируемых генов и белок-белковых взаимодействий. Функциональный анализ генов показал, что более крупные транскрипты часто связаны с развитием и функционированием нейронов. А более мелкие, как правило, играют роль в развитии кожи и в иммунной системе. Кроме того, более длинные гены участвуют в сигнальных путях, связанных с развитием онко- и сердечных заболеваний. Более мелкие — присутствуют в путях, связанных с иммунными ответами и нейродегенеративными заболеваниями. Кроме этого, как подчеркивают авторы, гены подлиннее, как правило, связаны с функциями, важными на ранних стадиях развития. А гены покороче, как правило, играют роль в повседневных функциях, которые важны на протяжении всей жизни и требуют быстрой реакции на стимул.

Теперь старение. Какие «наши» гены, связанные с продолжительностью жизни: длинные или короткие?

Длинные.

С чем это может быть связано? Для более длинных генов будет характерна высокая частота мутаций и нестабильность генома.

Кроме того, с возрастом, как показала команда Лорны Харрис, нарушается механизм регуляции сплайсинга. Что также будет нарушать нормальную функцию этих генов.

Кроме этого, как было недавно показано,5 с возрастом происходит подавление регуляции длинных транскриптов и усиление регуляции коротких транскриптов, что авторы работы назвали «дисбалансом транскриптома, обусловленным длиной». Который у людей больше всего заметен с возрастом в головном мозге.

Ещё одну характерную особенность длинных генов описали в прошлом году W. Li с коллегами.6 Как им удалось обнаружить, ретротранспозоны L1 преимущественно располагаются в более длинных генах. Естественно.

(Кстати, ретротранспозонам в нашей новой книге Open Longevity посвящена целая глава)

Некоторые из этих генов связаны с репарацией ДНК и подавлением ретротранспозонов.

То есть ретротраспозоны подавляют тех, кто их подавляет.

Ретротраспозоны могут действовать как транскрипционные «преграды», препятствующие экспрессии генов-хозяев. Помогает в этом ретротраспозонам особый вид метилирования их РНК: N6-метиладенозин.

Вы поняли?! Кто-то шустрый сейчас сделает ингибиторы N6–метиладенозин и получит стартап с оценкой в несколько сотен миллионов долларов.

Если этот текст наберёт 1000 комментариев, мы сделаем лекарство от старости. Хахаха. Думаю, до этого места дочитало 3 человека.

Как предполагают авторы, это управляемое метилированием РНК взаимодействие L1 – хозяин может играть широко распространенную роль в регуляции генов, целостности генома, развитии человека и формировании патологий.

Вроде такая простая тема, длина гена, а, смотрите, мы сколько с вами накопали.

Меня спрашивали, чем надо заниматься в старении? Вот всё изучать. Проводить эксперименты с N6-метиладенозином.

А также хорошо систематизировать всю полезную для борьбы со старением информацию, как мы и делаем в open-genes.com

Случайно лекарство от старости не создашь. Надо видеть картину целиком.

Читайте также

Генетическое редактирование

Подробнее

Напишите нам

  1. Ponomarenko, E. A., Poverennaya, E. V., Ilgisonis, E. V., Pyatnitskiy, M. A., Kopylov, A. T., Zgoda, V. G., Lisitsa, A. V., & Archakov, A. I. (2016). The Size of the Human Proteome: The Width and Depth. International journal of analytical chemistry, 2016, 7436849. https://doi.org/10.1155/2016/7436849[]
  2. Grishkevich, V., & Yanai, I. (2014). Gene length and expression level shape genomic novelties. Genome research, 24(9), 1497–1503. https://doi.org/10.1101/gr.169722.113[]
  3. Kirkconnell, K. S., Magnuson, B., Paulsen, M. T., Lu, B., Bedi, K., & Ljungman, M. (2017). Gene length as a biological timer to establish temporal transcriptional regulation. Cell cycle (Georgetown, Tex.), 16(3), 259–270. https://doi.org/10.1080/15384101.2016.1234550[]
  4. Lopes I, Altab G, Raina P, de Magalhães JP. Gene Size Matters: An Analysis of Gene Length in the Human Genome. Front Genet. 2021 Feb 11;12:559998. doi: 10.3389/fgene.2021.559998[]
  5. Stoeger, T., Grant, R. A., McQuattie-Pimentel, A. C., Anekalla, K., Liu, S. S., Tejedor-Navarro, H., … & Amaral, L. A. N. (2019). Aging is associated with a systemic length-driven transcriptome imbalance. BioRxiv, 691154. https://doi.org/10.1101/691154[]
  6. Xiong, F., Wang, R., Lee, J. H., Li, S., Chen, S. F., Liao, Z., Hasani, L. A., Nguyen, P. T., Zhu, X., Krakowiak, J., Lee, D. F., Han, L., Tsai, K. L., Liu, Y., & Li, W. (2021). RNA m6A modification orchestrates a LINE-1-host interaction that facilitates retrotransposition and contributes to long gene vulnerability. Cell research, 31(8), 861–885. https://doi.org/10.1038/s41422-021-00515-8[]