Геном человека,структура генов
Раздел 4. Современное определение понятия "ген",транскрипция, регуляторные элементы генов.
Около 10-15% генома человека представлено уникальными транскрибируемыми последовательностями, составляющими основу структурных генов (Льюин, 1987). В настоящее время в понятие"ген" включается не только его транскрибируемая область -экзоны + интроны, но также фланкирующие последовательности -лидерная, предшествующая началу гена, и хвостовая нетранслируемая область, раположенная на 3' конце гена (Рис.2.1 ). В отличие от генов прокариот гены человека редко представлены одной непрерывной последовательностью и в подавляющем большинстве имеют прерывистую структуру. Относительно короткие кодирующие участки - зкзоны, чередуются с длинными интронами, которые транскрибируются и входят в состав первичного РНК-продукта, но затем при процессинге первичного РНК-транскрипта они вырезаются и не участвуют в трансляции.Процесс вырезания интронов из первичных транскриптов получил название сплайсинга. Таким образом, в зрелой мРНК интронные области отсутствуют, а экзоны составляют непрерывную кодирующую последовательность. Размеры зрелых мРНК нередко в десятки раз меньше первичных РНК-транскрипов и, соответственно, размеров самого гена. Согласно классическим представлениям ген - это локус,на хромосоме, мутации в котором реализуются на уровне фенотипа. В молекулярной биологии ген трактуется как ассоциированный с регуляторными последовательностями фрагмент ДНК, соответствующий определенной единице транскрипции. Следовательно, представления о гене формальных генетиков далеко не полностью тождественны его физической единице и соотношения между этими двумя понятиями достаточно запутанные. Отметим некоторые причины этих противоречий. Известно, что мутации одного гена могут приводить к совершенно разным и даже в ряде случаев к комплементарным фенотипам. Результаты прямого секвенирования генома свидетельствуют о присутствии в нем значительного большего числа генов, чем можно ожидать от результатов мутационного анализа. Одна и та же последователь-ность ДНК в геноме может кодировать несколько различных белков, что достигается за счет так называемого альтернативного сплайсинга (образование разных мРНК из одного первичного РНК-транскрипта). В крупных интронах ряда генов обнаружены смысловые последовательности других генов ("ген в гене"),считываемые в противоположном направлении. Транскрипционные единицы генома могут перекрываться за счет наличия разных промоторов. Наконец, благодаря соматической рекомбинации структура транскрибируемых последовательнстей некоторых генов может быть различной в разных клонах клеток одного организма (Т-клеточные рецепторы). Ситуация с определением понятия "ген" еще больше осложняется, если в это понятие включать многочисленные регуляторные последовательности. Возникает вопрос: "Как далеко от гена могут располагаться эти последовательности, чтобы их можно было включать в структуру гена?". Для многих целей оказывается удобным введенное в последнее время понятие "считаемый ген"- counting gene.Последний рассматривается как отдельная транскрибируемая единица ДНК или её часть, которая может транслироваться в одну или несколько взаимосвязанных аминокислотных последова-тельностей. Поэтому последовательность, дающая две транскрипционные единицы за счет альтернативного сплайсинга и, как следствие, два разных белка учитывается как один ген.Однако, если степень гомологии двух генопродуктов, имеющих общий транскрибируемый участок, невелика, то эти последовательности расцениваются как два разных гена (Fields et al.,1994).
По своему функциональному назначению гены могут быть разделены на две группы. Группа I представлена генами, кодирующими собственно белки; группа II - генами, контролирующими синтез рибосомальных, транспортных и ядерных РНК. По характеру экспрессии гены также могут быть подразделены на две группы - гены "домашнего хозяйства" (housekeeping genes),продукты которых необходимы для обеспечения жизнедеятельности любого типа клеток, и тканеспецифические гены, обеспечивающие специализированные функции клеток, то есть гены,функционально активные только в определенных типах клеток(тканей) и только на определенных стадиях онтогенеза, так называемые гены терминальной дифференцировки.Считается, что средние размеры гена человека составляют, примерно, от 10 до 30 кб. Однако, эта величина может колебаться от нескольких десятков до миллионов пар нуклеоти-дов. Согласно последним данным, самый маленький из известных генов- МСС-7, имеет размеры всего 21 п.о. (Gonzales-Pastoret al.,1994), а самый болшой - ген дистрофина -2.2 мегабаз.Гены отделены друг от друга протяженными промежутками -спейсерами, содержащими в своем составе большое количество повторяющихся последовательностей ДНК и нетранскрибируемые уникальные последовательности.
Рассмотрим более подробно современные данные о числе генов в геноме человека. Полученные разными методами оценки этой величены приведены в Табл.2.1. Исходя из размера генома (около 3 000 миллионов п.о.), и среднего размера одного гена порядка 10 - 30 тыс.п.о. (Gilbert, 1992), общее число генов должно быть порядка 100 000. При этом, как уже указывалось,распределение генов на хромосомах крайне неравномерно. Установлено, что более 90% генов находится в Гимза -отрицатель-ных районах метафазных хромосом, в так называемых R-бэндах (Antequera,Bird ,1993). Проведенные недавно прямые исследования методом секвенирования показывают, что в R-бэндах их число достигает 43-50 на один бэнд, а в Гимза- положительных районах хромосом (G бэндах), - только 1-2 на 75-80 килобаз,то есть всего в геноме можно ожидать около 70 000 генов.Оценка числа генов по доле транскрибируемой части генома (всего 12%) дает совсем маленькую величину - 20 000 генов(Wagner et al.,1993). Методом исследования кинетики реассоциации РНК в культуре клеток число генов оценивается между 20 - 40 000 (Lewin, 1990). В то же время в клетках мозга число различных мРНК по некоторым данным достигает 97 000(Wagner et al.,1993). Наиболее точные подсчеты числа генов человека проведены в последнее время и основаны на оценке числа CpG островков (Табл.2.1). Известно, что в промоторной области всех генов "домашнего хозяйства" и примерно у 40 % генов терминальной дифференцировки, обеспечивающих специализированные функции дифференцированных клеток, находятся области коротких динуклеотидных CpG повторов. Разработаны молекулярные методы точной регистрации этих участков, которые показали, что их число в геноме около 45 000, отсюда число структурных генов оценивается в 67-70 000 ( Antequera, Bird,1993). Практически такое же число генов (64 000) определено недавно методом учета маркерных экспрессирующихся последовательностей (expressed sequence tags) (Fields et al., 1994).Таким образом, суммируя вышеизложенное, можно сделать вывод,что в геноме человека содержится, в среднем, около 70-80 000 отдельных транскрибируемых ДНК последовательностей, то есть генов.