Геном человека,структура генов
ГЕНОМ ЧЕЛОВЕКА, СТРУКТУРА ГЕНОВ.
Раздел 1. Определение генома и его основных элементов.
Термин геном используется для обозначения полной генетической системы клетки, определяющей характер онтогенетического развития организма и наследственную передачу в ряду поколений всех его структурных и функциональных признаков.Понятие генома может быть применено к таксономической группе, виду, отдельной особи, клетке, микроорганизму или вирусу. Так, можно говорить о структуре генома эукариот и прокариот, сравнивать геномы разных видов, изучать особенности строения генома у конкретных индивидуумов или следить за изменениями, происходящими в геноме специфических клеток в процессе их онтогенетической дифференцировки. Часто геном определяется как генетическая информация, заключенная в молекулах ДНК одной клетки. Однако, такие факты, как отсутствие связи между количеством ДНК в расчете на гаплоидный геном и таксономическим статусом видов, а также многочисленные примеры существования огромных различий в содержании ДНК между близкородственными видами (так называемый"С-парадокс") свидетельствуют о том, что далеко не все участки ДНК связаны с информационными функциями. Понятия генома и ДНК в значительной степени тождественны, так как основные принципы организации и функционирования генома целиком определяются свойствами ДНК. Присущие этим молекулам потенциальные возможности практически неограниченного структурного разнообразия определяют все многообразие мира живых существ, как на уровне межвидовых, так и индивидуальных различий в пределах одного вида (Баев и др.,1990; Ратнер,1985).Процесс эволюции и дифференцировки отдельных видов, как правило, сопровождался накоплением изменений в структуре генома. Это касается, прежде всего, таких параметров, как локализация и характер упаковки ДНК в клетках; количество ДНК,приходящееся на гаплоидный геном; типы, соотношение и функции кодирующих и некодирующих нуклеотидных последовательностей; регуляция экспрессии генов; межпопуляционная вариабильность и филогенетический консерватизм первичной структуры генома. В пределах одного вида основные параметры генома достаточно постоянны, а внутривидовое разнообразие обеспечивается за счет мутационной изменчивости, то есть выпадения,вставки или замены нуклеотидов на сравнительно небольших участках ДНК. Чаще всего такие изменения касаются неэкспрессируемых элементов генома (интронов, псевдогенов,межгенных спэйсерных участков ДНК и т.д.).Геномы эукариот, посуществу, можно рассматривать как мультигеномные симбиотческие конструкции, состоящие из облигатных и факультативных элементов (Golubovsky, 1995). Основу облигатных элементов составляют структурные локусы, количество и расположение которых в геноме достаточно постоянно.Присутствие в хромосомах некоторых видов повторяющихся ДНК,амплифицированных участков, ретровирусных последовательностей, псевдогенов, также как наличие в клетке эписом, ретротранскриптов, ампликонов, дополнительных B-хромосом и различных цитосимбионтов (вирусов, бактерий, простейших) является не строго обязательным, их количество и положение может значительно варьировать, то есть эти элементы являются факультативными. В то же время участие факультативных элементов в наследственной передаче признаков, в формировании мутационной изменчивости и в эволюционных преобразованиях видов несомненно доказано. Кроме того, существует непрерывный переход от одних состояний к другим за счет инсерции экстрахромосомных ДНК в хромосомы и выстраивания транспозоноподобных мобильных элементов из хромосом. Следовательно,несмотря на значительные отличия факультативных последовательностей от облигатных по характеру основных информационных процессов (репликации, транскрипции, трансляции и сегрегации), они также должны рассматриваться, как важнейшие элементы генома.Остановимся теперь более детально на основных принципах организации генома человека. В каждой диплоидной клетке с 46 хромосомами содержится около 6 пикограмм ДНК, а общая длина гаплоидного набора из 23 хромосом составляет 3.5 * 10!9 пар нуклеотидов (Kao, 1985). Этого количества ДНК достаточно для кодирования нескольких миллионов генов. Однако, по многим независимым оценкам истиное число структурных генов находится в пределах от 50 000 до 100 000. В разделе 2.4 изложены современные подходы, используемые для подсчета общего количества генов, из которых следует, что наиболее вероятная оценка их числа составляет около 80 000. Сопоставляя это значение со средними размерами гена и соотношением между величиной их экзонных и интронных областей, можно заключить,что кодирующие последовательности ДНК занимают не более 10-15% всего генома (McKusick, Ruddle, 1977). Таким образом,основная часть молекул ДНК не несет информации об аминокислотной последовательности белков, составляющих основу любого живого организма, и не кодирует структуру рибосомальных, транспортных, ядерных и других типов РНК. Функции этой "избыточной" (junk) ДНК не ясны, хотя ее структура изучена достаточно подробно. Предполагается, что эта ДНК может участвовать в регуляции экспрессии генов и в процессинге РНК, выполнять структурные функции, повышать точность гомологичного спаривания и рекомбинации, способствовать успешной репликации ДНК и, возможно, является носителем принципиально иного генетического кода с неизвестной функцией.Наиболее общая характеристика генома может быть получена с помощью анализа кинетики реассоциации молекул ДНК. Динамика плавления геномной ДНК обнаруживает присутствие по крайней мере трех различающихся по химической сложности фракций(Льюин, 1987; Газарян, Тарантул, 1983). Быстро ренатурирующая фракция ДНК состоит из относительно коротких высокоповторяющихся последовательностей; в промежуточную фракцию входит множество умеренно повторяющихся ДНК - более протяженных, но представленных меньшим числом копий; медленно ренатурирующая фракция объединяет в себе уникальные последовательности ДНК, встречающиеся в геноме не более 1-2 раз.С помощью молекулярного анализа проведена идентификация основных классов повторяющихся последовательностей ДНК,составляющих более 35% всего генома человека и включающих сателлитную ДНК, инвертированные повторы, умеренные и низкокопийные повторы, а также мини- и микросателлитные последовательности ДНК. Классификация этих типов повторов достаточно условна и основана, главным образом, на двух характеристиках: длине повторяющихся коровых единиц, которая может варьировать от 1-2 до более, чем 2000 п.о., и числе их копий, также меняющихся в очень широких пределах - от десятка до миллиона на гаплоидный геном. Не менее важными характеристиками различных классов повторяющихся ДНК являются нуклеотидная последовательность "коровых" единиц повтора, специфичность их организации, хромосомная локализация, внутрии межвидовая стабильность, а также возможные функции этих типов ДНК.
Раздел 2. Повторяющиеся последовательности ДНК.
Сателлитная ДНК это класс высокоповторяющихся последовательностей, составляющих около 10% всего генома человека (Kao, 1985). При центрифугировании геномной ДНК в градиенте плотности CsCl эти последовательности образуют четыре отдельных сателлитных пика с различными средними значениями плавучей плотности. Методом гибридизации in situ показано присутствие сателлитной ДНК преимущественно в центромерных,теломерных и гетерохроматиновых районах большинства хромосом, при этом характер гибридизации сходен для всех четырех групп и не зависит от принадлежности ДНК-зондов к семействам повторов, образующих различные сателлитные пики. В каждой из этих групп, однако, присутствует небольшое количество последовательностей, имеющих специфическую хромосомную локализацию. Так например, около 40% длинного плеча Y хромосомы составляет семейство последовательностей, тандемно повторяющихся более 3000 раз и не найденных в других хромосомах.Выделяют три основных типа сателлитной ДНК: (1) короткие- от 2 до 20 п.о., стабильные тандемные повторы с кратностью в несколько десятков тысяч раз, которые иногда перемежаются с неповторяющимися последовательностями; (2) кластеры более протяженных повторов, слегка различающихся по нуклеотидной последовательности; (3) сложные, достигающие нескольких сотен пар нуклеотидов, повторяющиеся последовательности различной степени гомологии (Газарян,Тарантул,1983). К последнему типу относятся альфа-сателлитные или альфоидные ДНК,среди которых найдено много хромосом-специфических последовательностей. Размеры повтрояющихся "коровых" единиц альфоидной ДНК составляют около 170-200 п.о. В геноме человека и других приматов эти мономеры организованы в кластеры по 20 и более "коровых" единиц. После расщепления рестриктазой BamHI в альфоидной ДНК выявляется серия фрагментов, длиной около 2000 п.о., в составе которых обнаруживаются альфоидные последовательности, специфичные для гетерохроматиновых районов разных хромосом человека (1, 3, 4, 5, 9, 6, 7, 11, 17, 19,Х). В некоторых случаях эти повторы гомологичны двум разным хромосомам (9 и 15, 13 и 21, 18 и Х) ( Willard,Waye, 1987).Хромосом-специфические последовательности сателлитной альфо-идной ДНК нашли широкое применение в молекулярной цитогенетике в качестве ДНК-зондов, удобных для маркирования индивидуальных хромосом в метафазных и интерфазных клетках человека (Юров, 1987). Предполагается, что сателлитные ДНК играют важную роль в поддержании структур хромосом и, возможно, в их спаривании в процессе мейоза (Charlesworth et al., 1994).Особое место среди сателлитных ДНК занимают микро- и минисателлитные последовательности, представляющие собой многочисленную группу рассеянных по всему геному относительно коротких тандемных повторов. Микросателлиты - это класс динуклеотидных повторов. Размер повторяющихся единиц в минисателитных последовательностях может меняться от 3 - 4 до 10 - 15 нуклеотидов. Отличительной особенностью микро- и минисателлитов является наличие среди них большого количества участков, вариабильных по числу копий в кластере.Инвертированные или обращенные повторы составляют до 5% генома. Они состоят из двух тождественных копий длиной около 300 п.о., ориентированных в противоположных направлениях на одной нити ДНК и лежащих на расстоянии от нуля до десятка тысяч пар нуклеотидов друг от друга (в среднем - 1,6 кб).Около 1/3 обращенных повторов не разделены промежуточными последовательностями и носят название палиндромов. Среднее расстояние между двумя различными парами инвертированных повторов около 12 кб, и их распределение по геному носит случайный характер. Комплементарные пары легко ассоциируют при отжиге, образуя шпилечные структуры с дуплексной ножкой и однонитевой петлей, длина которой соответствует расстоянию между парой обращенных повторов. Вследствие этого оказываются приблеженными достаточно удаленные друг от друга участки ДНК, что важно для работы ряда ферментов, обеспечивающих процессы репликации и транскрипции. Важно отметить и то, что однонитевой участок ДНК, образующий петлю, становится доступным для действя нуклеазы S1, специфически разрушающей однонитевую ДНК.