Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,593

CHARACTERISTICS OF GENOME REGULATORY ELEMENTS

Oleynik D.A. 1 Rodina E.Yu. 1
1 Sakhalin State University
1775 KB
In this project, based on literature analysis, we have put together generalized data concerning DNA organization, chromatin packing and structure, functionality, regulation of the genes of living things. Short description of structural and regulatory genes is given. The importance of CTCF protein in DNA organization. Contemporary understanding of the most important regulatory elements of the genome, such as promoters, enhancers, silencers and insulators, mechanisms of their action and epigenetic regulation is outlined. It has been based on already established data that DNA organization determines gene activity and non-coding DNA affects gene expression. The importance of genome regulatory elements is showed by Drosophila melanogaster embryo development.
DNA
chromatin packing levels
gene expression
promoter
enhancer
silencer
insulator
regulatory elements
epigenetic regulation

Существуют модели, предположения и теории, касающиеся организации и деятельности генома. Однако точные механизмы взаимодействия его отдельных элементов остаются до сих пор до конца не выясненными. В связи с этим большое значение имеет объединенная характеристика имеющихся сведений о функционировании генома. Учитывая значительный объем проведенных исследований, предлагаем обобщенные данные об организации и деятельности генов, работа которых зависит от пространственной укладки ДНК, структуры и влияния регуляторных элементов генома, а также эпигенетических факторов.

Структура генов

По функциональным особенностям выделяют две группы генов: структурные и регуляторные. Регуляторными называют гены, деятельность которых влияет на экспрессию других генов – структурных. Таким образом, белковые продукты структурных генов оказываются своего рода целевыми, а регуляторных – вспомогательными.

В пределах самих генов в структурном отношении можно выделить следующие составные части:

1. Кодирующая часть, где зашифрована информация о белках – область экзонов.

2. Обширные многочисленные области, расположенные между генами, большинство которых не кодирует ни один белок – интроны, характерные для генов эукариотических организмов.

Несмотря на то, что интроны не кодируют белки, с них тоже может считываться РНК (non-protein-coding RNA – ncRNA). На примере работ с Caenorhabditis elegans были получены данные о том, что такие РНК играют значительную роль в регуляции экспрессии генов. Было установлено, что продуктами гена lin-4 являются малые некодирующие РНК, полученные из интронов. Они регулируют экспрессию гена lin-14, который, в свою очередь, участвует в регуляции постэмбрионального развития этих животных [1].

Отдельную структурную группу составляют регуляторные зоны генов, которые представлены такими последовательностями ДНК, как промоторы, энхансеры, сайленсеры и инсуляторы.

Существуют еще особые мобильные элементы генома, присущие как прокариотам, так и эукариотам – транспозоны. Наличие транспозонов с самого начала расценивали как паразитизм [2], так как в состоянии активности они способны распространять свои копии по геному, разрывать гены, кодирующие белки, приводить к различным мутациям и нарушениям в работе генов [3]. В связи с такой угрозой клетка обязана защищать геном от последствий активности транспозонов. Существует несколько таких механизмов защиты, но исследования последних лет показали, что основным из них является РНК-интерференция (RNAi), в ходе которой при помощи малых РНК подавляется экспрессия мобильных элементов [4]. Однако в редких случаях активность транспозонов может вызывать и полезные мутации, играя важную роль в эволюционном процессе [5].

Пространственная организация ДНК

Для объяснения процессов, связанных с функционированием генома, необходимо рассмотреть организацию ДНК в пространстве.

Известно, что ДНК вместе со специальными белками образует комплекс, известный как хроматин, который, в свою очередь, имеет несколько уровней пространственной организации, благодаря чему ДНК компактно укладывается в ядре. От такой организации хроматина зависит наличие доступа к генетической информации.

В 1974 году [6] стало известно, что хроматин содержит в своем составе белки – гистоны: H1, H2A, H2B, H3 и H4. По две копии H2A, H2B, H3 и H4 (коровых гистонов) образуют основу – октамер, вокруг которой оборачивается участок ДНК длиной 145–147 пн, и данная структура – нуклеосома – составляет около 10 нм в диаметре [7; 8].

ДНК способна также взаимодействовать со специальными негистоновыми белками, сходными по строению с гистонами, и с вариантными формами гистонов, оказывающими влияние на степень активности генов [9].

В связи с определенным разнообразием белков, входящих в состав коровых частиц, нуклеосомы не одинаковы по составу. Следует отметить, что прикрепление нити ДНК к октамеру не зависит от конкретных азотистых оснований, поскольку гистоны взаимодействуют с фосфодиэфирным остовом и остатками рибозы [9]. Между соседними нуклеосомами находится участок ДНК – линкер, длина которого составляет 10–90 пн, в зависимости от вида организма, типа клеток и участков генома. Еще один гистон – Н1 отличается по размеру и структуре от коровых, связывается с линкером и играет важную роль в поддержании нуклеосомной структуры хроматина [8].

До недавнего времени полагали, что вторым уровнем упаковки ДНК являются более компактно уложенные нуклеосомные нити, имеющие диаметр 30 нм [9], однако были получены данные, свидетельствующие о том, что это не так и основная единица – все-таки нуклеосомная нить диаметром 10 нм [8]. Регуляция экспрессии генов может осуществляться уже на этом уровне посредством степени компактности хроматина.

Таким образом, ДНК упакована не равномерно, а с присутствием участков большей и меньшей своей концентрации. Плотно упакованные участки называют гетерохроматином, и здесь транскрипция неактивна, а более разреженно упакованные – эухроматином, где расположена транскрипционно-активная ДНК [10].

На следующем уровне упаковки нуклеосомная нить, или фибрилла, укладывается в петли, во множество раз сокращая занимаемое ею место и образуя специализированные домены.

Несмотря на то, что данные об образовании таких петель были представлены еще в прошлом столетии [11], секрет процесса петлеобразования был открыт лишь в 2015 г. командой ученых из разных институтов [12]. Исходя из полученных данных, важнейшую роль в этом процессе играет белок CTCF: 2 его молекулы опускаются на нить ДНК, которая начинает протягиваться через них так, что процесс напоминает подгонку лямок рюкзака. Процесс длится до тех пор, пока белок не достигнет особого участка связывания, который сработает как сигнал остановки.

Такие петли, собираясь, образуют специализированные домены, а многоступенчатая технология упаковки ДНК необходима не только для минимизации занимаемого пространства, но и для обеспечения работы регуляторных механизмов.

Регуляторные элементы генов

Как было установлено, далеко не все участки ДНК кодируют белки. Для обозначения таких участков был предложен специальный термин «junk DNA», что в переводе означает «мусорная ДНК». В начале ХХ столетия был совершен ряд открытий, показавший, что эти участки вовсе не бесполезны, как казалось ранее. Эти последовательности несут в себе скрытую информацию, благодаря которой происходят процессы, обеспечивающие функционирование различных клеток, а изменения, происходящие в этих зонах, влекут за собой возникновение и развитие некоторых заболеваний. Было экспериментально установлено, что некодирующая ДНК влияет на регуляцию экспрессии генов, синтеза белков, может выступать в роли энхансеров и сайленсеров для различных генов. При этом один ген может управляться несколькими регуляторными участками [13]. Помимо этого, с регуляторными участками имеют способность связываться транскрипционные факторы – специфические белки, контролирующие процесс синтеза РНК, т.е. транскрипцию, усиливая или ослабляя ее.

Таким образом, чтобы обеспечить функционирование генов и контроль их работы, необходимы специальные структуры, которые действуют в зависимости от потребностей живого существа, чья жизнь зависит от этих генов. Регуляторные участки также имеют свою уникальную структуру, каждая такая зона включает в себя особые элементы.

Среди регуляторных элементов выделяют: промоторы, удаленные регуляторные элементы, а также «архитектурные» элементы.

Промоторами называют области ДНК, с которых начинается транскрипция, осуществляющаяся при помощи РНК-полимеразы, которая узнает промотор как сигнал к старту транскрипции. За считывание генов эукариот, кодирующих белки, отвечает РНК-полимераза II. В целом в строении промоторов можно выделить следующие элементы [14]:

1. ТАТА-бокс – специфическая последовательность нуклеотидов, ориентирующая РНК-полимеразу у эукариот; у прокариот ту же функцию выполняет бокс Прибнова.

2. Inr – Initiator – инициатор.

3. BREu – upstream TFIIB recognition element – предшествующий TATA-боксу участок связывания TFIIB.

4. BREd – downstream TFIIB recognition element – следующий за TATA-боксом участок связывания TFIIB.

5. Нижний промоторный элемент – downstream promoter element DPE и некоторые другие мотивы нуклеотидной последовательности.

В состав разных промоторов могут входить различные элементы. Функционируют эти элементы по следующей модели. Для начала транскрипции с ТАТА-боксом связывается специальный белок TBP – TATA-Binding Protein [14; 15]. Вокруг него впоследствии и собираются необходимые здесь транскрипционные факторы TFIIA, TFIIB, TFIID, TFIIF, TFIIE и TFIIH и туда же направляется РНК-полимераза для начала транскрипции [16]. Сборка этого сложного комплекса осуществляется в Inr-элементе. Однако не все промоторы содержат ТАТА-бокс, и такие промоторы находятся в CpG-островках – это короткие последовательности диной 500–1000 тпн, GC-богатые, в которых соотношение СpG- и GpC-нуклеотидных пар близко к единице [15]. Промоторы можно отследить в последовательности ДНК по особым отличительным признакам: большинство из них содержат участок без нуклеосом или нуклеосома нестабильна и включает такие вариантные гистоны, как H2A.Z и H3.3 [17].

Удаленные регуляторные элементы способны контролировать процесс транскрипции. К таким элементам относят энхансеры и сайленсеры. Энхансерами называют регуляторные последовательности, которые активируют транскрипцию. При этом они способны функционировать, находясь в разной ориентации: цис- или транс- и на значительном расстоянии относительно промотора – до сотен тысяч пар нуклеотидов [18]. Таким образом, в зоне действия энхансеров оказываются не только целевые, но и другие промоторы, в зоне которых влияние энхансеров ограничивают инсуляторы.

Механизм такой «разборчивости» энхансеров относительно промоторов до сих пор не ясен, но, вероятно, здесь задействованы особые белок-белковые взаимодействия между компонентами этих регуляторных элементов [15].

Исследования также показали, что большая часть энхансеров эукариот проявляет тканевую специфичность [19], которая определяется индивидуальным набором участков связывания транскрипционных факторов, из которых и состоят энхансеры. Сам механизм действия энхансеров изучен недостаточно полно. Относительно его действия имеются различные точки зрения: например, что энхансеры могут привлекать в область промоторов тканеспецифичные транскрипционные факторы и дополнительные компоненты, влияющие на конфигурацию хроматина; собирать на себе преинициаторный комплекс и доставлять его на промотор, а также стабилизировать этот комплекс. Все эти модели предполагают регулирование сборки преинициаторного комплекса [15].

Имеются также предположения о том, что стадией, подконтрольной энхансерам, является не сборка комплекса, а процесс отсоединения РНК-полимеразы от промотора, т.е. переход к стадии элонгации [20]. Также было установлено, что на энхансерах синтезируются особые транскрипты, названные энхансерными РНК – eRNA, которые также обладают способностью усиливать активность промотора [21; 22]. Показано, что работу одного гена или нескольких, функционально связанных, могут контролировать несколько энхансеров. Существует мнение о том, что такие энхансеры и зависимые промоторы объединены в специализированные активаторные хроматиновые блоки – active chromatin hub [23]. В работе Гаврилова и др. [24] представлены данные, на основании которых следует, что такие структуры являются динамичными, т.е. отдельные регуляторные элементы могут входить в состав нескольких блоков, поэтому должны «переключаться» для работы в одной из них. Такие блоки помогает образовывать белок CTCF [25].

В свою очередь, благодаря сайленсерам снижается активность транскрипции генов, за счет сборки на них белковых комплексов, подавляющих экспрессию, поэтому считается, что это регуляторный элемент, противоположный по действию энхансерам. Так, в эту группу включают PRE, которые являются участками связывания белков группы Polycomb, подавляющих активность соседних генов. Причем, по результатам исследований Швартца и др. [26], они не только способны полностью сайленсировать транскрипцию, но и работать на более тонком уровне регуляции активности генов. Такие белки образуют сложные комплексы, которые упаковывают хроматин до состояния, недоступного для транскрипции [27–29], т.е. механизмы их действия отличаются от энхансеров, т.к. сайленсеры работают с конфигурацией хроматина [15]. Появились данные о том, что функции сайленсеров не столь однозначны, в частности было показано, что белки группы PcG, а именно RING1, необходимы для обеспечения энхансер-промоторных взаимодействий посредством реорганизации хроматина, результатом чего становится активация транскрипции [30].

Существует еще и третья группа регуляторных элементов – архитектурные элементы. Их задача заключается в поддержании и регулировании контактов между участками ДНК. Наиболее изучены из этой группы такие элементы, как инсуляторы, которые регулируют взаимодействия между энхансерами и промоторами. Их принято разделять на две категории в соответствии со спецификой их работы. Так, выделяют инсуляторы, которые способны блокировать взаимодействие между энхансером и промотором, если расположены между ними, и инсуляторы, которые защищают трансгены от распространения гетерохроматина, подавляющего активность соседних участков. Как именно осуществляются эти функции, до сих пор не ясно.

Благодаря анализу имеющихся данных [25], становится понятно, что основная часть инсуляторов позвоночных CTCF-зависима. На основании механизма образования петель при помощи данного белка, вероятно, инсуляторы способны регулировать активность генов за счет пространственной организации ДНК. Существенную роль в этом также играет и когезин – белок, известный своей ролью при сближении сестринских хроматид, поэтому можно предположить, что он также участвует в установлении контактов между частями различных петель в пределах одной хромосомы [31]. В месте локализации инсуляторов образуются активные хроматиновые домены, отличающиеся особым сочетанием вариантных гистонов [15].

Все рассмотренные механизмы регуляции экспрессии генов жизненно необходимы для всех организмов, особенно на этапе дифференцировки клеток у многоклеточных. В сложно устроенных живых организмах при идентичном наборе хромосом и, соответственно, генетическом коде наблюдается множество типов клеток, которые проходят процесс дифференцировки на определенном этапе развития. Так, у D. melanogaster комплекс гомеозисных генов Bithorax (BX-C) отвечает за развитие сегментов задних двух третей тела мушки, осуществляемое с участием различных регуляторных элементов. ВХ-С содержит только 3 гена, однако определяют они 14 парасегментов зародыша [32–35]. По мере изучения данного вопроса и накопления знаний в области регуляции экспрессии генов, было установлено наличие в BX-C особых морфогенов, контролируемых материнским геномом, энхансерных и сайленсерных последовательностей, которые контролировали степень активности генов в каждом конкретном сегменте, а белки, кодируемые гомеозисными генами, в свою очередь, влияют на индивидуальное развитие сегментов. Для такой регуляции предназначены гены групп Pоlycomb и Thrithorax: первые поддерживают неактивное состояние генов, а вторые – действуют в противовес, усиливая экспрессию [36–39]. Они связываются с особыми последовательностями – PRE и TRE. Считается, что для обеспечения взаимодействий различных регуляторных элементов с целевыми генами BX-C разбит на регуляторные домены, разделенные инсуляторами. Таким образом, концентрация морфогенов влияет на активацию тех или иных сегментационных генов, что дает информацию об активности домена [40].

В процессе дифференцировки клеток ключевую роль играет механизм эпигенетической памяти – регуляция следующего порядка [8].

Эпигенетическая регуляция генома

Долгое время считалось, что только гены, т.е. определенные участки ДНК (а у некоторых вирусов – РНК) определяют физиологию и дифференцировку клеток, а значит – строение и развитие всего организма. Однако начиная примерно с середины ХХ столетия ученые всего мира постепенно пришли к выводу, что существуют механизмы, работающие на уровне, находящемся над генами. Факторы, которые контролируют активность генов, но при этом не влияют на последовательность нуклеотидов, в отличие от мутационных изменений, назвали эпигенетическими. Так, уже в 1958 г. Дэвид Нэнни указывал на трудности с пониманием границы между регуляцией посредством ДНК и эпигенетической регуляцией, вследствие наследуемости эпигенетических признаков. Как было установлено, гены, несомненно, являются основой генома, но составляют лишь его часть, поэтому в генетике появился важный раздел, занимающийся наследственностью, не связанной с последовательностью ДНК, – эпигенетика.

Примером проявления эпигенетической регуляции работы генов считают изменение их активности. Некоторые из них, наиболее важные в жизнедеятельности организма, могут «работать», т.е. находиться в активном состоянии, в течение всей жизни. Однако другие, чьи функции необходимы только, например, в экстремальных ситуациях, активируются при определенном внешнем воздействии. Иногда происходят сбои в работе этой системы, а информация об изменении генетической активности фиксируется, запоминается и передается потомкам. Гены при этом остаются в прежнем составе, т.е. мутации не происходит, однако регуляция экспрессии гена становится иной, меняя конечный результат. Таким образом, эпигенетическая регуляция позволяет изменять функционирование определенных генов в ответ на действие различных факторов [41]. В качестве основных видов эпигенетических механизмов называют модификации гистонов, метилирование ДНК и некодирующие РНК, из которых наиболее хорошо изучены первые два.

Модификации гистонов – это изменение аминокислотных остатков (метилирование, ацетилирование, фосфорилирование), входящих в конкретный гистон [42]. Примером может послужить достаточно хорошо изученный вариантный гистон Н2А.Z, оказывающий влияние на формирование активного/неактивного хроматина [43], ДНК метилированию подвергается цитозин [44]. Оба этих процесса определяют степень плотности упаковки ДНК, что влияет на активность генов. Некодирующие РНК необходимы организмам, т.к. они участвуют в развитии и экспрессии генов, однако некоторые из них являются причиной заболеваний. Определенные некодирующие РНК функционируют как онкогены, являются маркерами и мишенями при лечении некоторых заболеваний [45; 46].

Эпигеном разнится в каждом типе клеток, что позволяет им отличаться друг от друга. В каждой клетке регуляция экспрессии генов осуществляется по-своему: на уровне организации ДНК, плотности упаковки и т.д., сохраняя информацию о предыдущих транскрипциях [47]. Доказательства наследуемости эпигенетических признаков были получены еще в 1998, когда установили, что области перекрытия PRE и TRE в составе ВХ-С способны эпигенетически регулировать экспрессию генов в ходе деления [48]. Также были найдены связи между эпигенетической памятью и возникновением ожирения на примере мышей [49], а также процессами старения [50].

Заключение

Таким образом, в процессе длительных генетических исследований было определено, что геном – основной определяющий фактор в жизни живых организмов. Кроме того, устройство генов, будь то структурные или регуляторные гены, универсально.

Упаковка хроматина влияет на наличие доступа к генетической информации, т.е. степень ее экспрессии, а образование петель регулирует работу генома посредством создания специализированных доменов и обеспечивает работу регуляторных механизмов. Ведущую роль в этом, как оказалось, играет белок CTCF, который задействован еще и в образовании активных хроматиновых блоков и влияет на деятельность инсуляторов.

Такие структурные элементы генов, как промоторы, энхансеры, сайленсеры, инсуляторы в совокупности составляют взаимосвязанную и взаимозависимую регуляторную систему. Было установлено, что роль сайленсеров неоднозначна и отдельные представители этой группы регуляторных элементов способны активировать транскрипцию.

На примере D. melanogaster показана жизненная необходимость организма в правильной регуляции работы генома, особенно на стадии дифференцировки клеток. Было выяснено, что значительная часть регуляции обеспечивается системой более высокого порядка – эпигенетической.

Таким образом, без точных знаний структуры, функций и принципов работы элементов, регулирующих экспрессию генов, невозможно создавать искусственные функционирующие гены, предупреждать и лечить недуги, связанные с нарушением деятельности генома. Кроме того, эпигенетические особенности генома могут служить маркерами при диагностике различных заболеваний.