Более эволюционно консервативные гены часто длиннее. У них также часто бОльшая интронная нагрузку, то есть большее число некодирующих белок фрагментов гена — интронов.
Интроны, как нам рассказал Евгений Кунин, появились в ДНК наших древних предков после симбиоза с митохондриями. От митохондрий новая клетка, кроме прочего, получила и бактериальные транспозоны. Которые стали встраиваться в геном клетки и превращаться в некодирующие вставки — интроны.
Так получился альтернативный сплайсинг, и с одного гена теперь считается гораздо больше белков. Точнее, протеоформ. Один ген — один белок, а вот форм несколько, протеоформ.
Их обычно выделяют трёх видов:
- продукты альтернативного сплайсинга;
- протеоформы, содержащие полиморфизмы одиночных аминокислот (single amino-acid polymorphisms (SAPs)), возникающие из несинонимичных однонуклеотидных полиморфизмов (nsSNP);
- те, которые подвергаются посттрансляционным модификациям.
В 2016 году биохимики из ИБМХ РАН насчитали
больше 6 миллионов протеоформ. А генов-то 19 (21,5?) тысяч.
Понимаете теперь, какой важный процесс — альтернативный сплайсинг и насколько интересный такой параметр, как длинна гена?
Кстати, есть белки, которые трудно или даже невозможно обнаружить. В мембранах много трудно растворимых белков. А ещё много генов, для которых невозможно поймать транскрипты, потому что у некоторых участков хромосом недоступный хроматин: если уровень экспрессии транскриптов слишком низок для чувствительности современных инструментов, масс-спектрометрия их не увидит.
Ещё есть пептиды (короткие белки) и на 2022 год их
насчитали 2 954 162.
Причём пептидная регуляция — самый топ в старении, требующая невероятного объема исследований, как, впрочем, и всё остальное.
По версии Кунина, благодаря слиянию с митохондриями у прокариот появилось и ядро, разделение транскрипции (в ядре) от трансляции (в цитозоле клетки). Но это отдельная история.
При этом длина гена — вещь непостоянная. Ген становится длиннее по ходу эволюции, частично из-за вставок мобильных элементов. А вот после дупликации ген может оказаться короче. Дупликация — это когда раз, и появляется вторая копия гена из-за разных там хромосомных дел.
Таким образом, длина генов коррелирует как с дупликацией генов, так и с альтернативным сплайсингом: более длинные гены с меньшей вероятностью будут производить дубликаты и с большей — демонстрировать альтернативный сплайсинг.
Эволюционная линия, ведущая к многоклеточным животным, отмечена ростом сложности организма, выразившемся в развитии клеточных компонентов и появлении новых типов клеток. Ну и старение — оно тесно связано именно с многоклеточностью. Так-то прокариоты старение победили и два миллиарда лет обходились без него (репликативное не считается).
Такое усложнение живого должно происходить на фоне геномных изменений. И механизмы дупликации генов и альтернативного сплайсинга играют здесь главную роль. Оба эти источника эволюционной новизны допускают появление функций, не затрагивая ранее существовавшие. Таким образом, могут способствовать возникновению вариаций, необходимых для роста сложности.
Более экзотические способы инноваций, такие как фактическое происхождение генов, кодирующих белок, из некодирующих белок последовательностей, также могут способствовать эволюции генома. Но, как считается, их вклад вряд ли будет сопоставим с вкладом дупликации генов.
Кроме того, потеря генов, которая выступает неотъемлемым аспектом эволюционного процесса и была обширной в некоторых линиях, также может вызывать появление новых генов.
Иногда ген, присутствующий в определенной линии, кажется новым, потому что его гомологи в других линиях были потеряны в ходе эволюции.
При этом процессы появления и потери гена неразрывно связаны, поскольку оба, как правило, происходят в период эволюционного «свободного падения», когда ген свободен от ограничений очищающего отбора.
Ещё одна взаимосвязь с размером гена — уровень его экспрессии.
Самая высокая экспрессия характерна для коротких генов.
Гены с высокой экспрессией будут продуцировать более короткие белки, что снизит затраты организма на трансляцию. Положительный отбор не мог пройти мимо такого шанса получить эволюционное преимущество.
Почему же тогда сохраняются длинные гены, синтезировать с которых белок организму дольше и труднее?
Например, ген длиной 100 пар оснований потребует всего несколько секунд для завершения элонгации транскрипции, в то время как у гена длиной 2 миллиона пар оснований это займет целые сутки.
Одна из возможных причин такого разнообразия размеров генов — возможность устраивать сигнальные каскады, поочередно синтезируя белки из генов разной длины. То есть чтобы нужные белки появлялись в ответ на какой-то стимул не все сразу, а с очерёдностью, заданной длиной генов.
То есть такая эшелонированная реакция. Тот же стресс-ответ так устроен.
Статья об этом Mats Ljungman с коллегами так и называется: Длина гена как биологический таймер для установления временной регуляции транскрипции.
Ещё одна возможная причина сохранения длинных генов в процессе эволюции: альтернативный сплайсинг, характерный для длинных генов, позволяет расширить белковое разнообразие.
Тут вообще возникает фантастически интересный вопрос: а почему вообще сложность в ходе эволюции нарастает? Почему бы человеку обратно в бактерию не превратиться? Так сложно всё в этой жизни.
Как описал в своей работе 2021 г. Joao Pedro de Magalhaes,
главный человек в системной биологии старения, длинные гены в основном экспрессируются в кровеносных сосудах, щитовидной железе, головном мозге и нервной ткани. Тогда как самые маленькие, как правило, — в поджелудочной железе, коже, желудке, влагалище и яичках.
Естественный отбор подавляет изменения для генов с более длинными транскриптами и способствует изменениям для генов с меньшими транскриптами.
Также авторы наблюдали, что гены с более длинными транскриптами, как правило, имеют большее количество коэкспрессируемых генов и белок-белковых взаимодействий.
Функциональный анализ генов показал, что более крупные транскрипты часто связаны с развитием и функционированием нейронов. А более мелкие, как правило, играют роль в развитии кожи и в иммунной системе.
Кроме того, более длинные гены участвуют в сигнальных путях, связанных с развитием онко- и сердечных заболеваний. Более мелкие — присутствуют в путях, связанных с иммунными ответами и нейродегенеративными заболеваниями.
Кроме этого, как подчеркивают авторы, гены подлиннее, как правило, связаны с функциями, важными на ранних стадиях развития. А гены покороче, как правило, играют роль в повседневных функциях, которые важны на протяжении всей жизни и требуют быстрой реакции на стимул.