Секвенирование дезоксирибонуклеиновой кислоты (ДНК)
Введение
К концу 70-х годов перед исследователями, работавшими в сфере молекулярной биологии, остро встала проблема установления последовательности нуклеотидов в цепи ДНК («секвенирования ДНК»). Как подойти к решению этой проблемы? За 10 лет до того Эрдманом и Беггом была решена задача выяснения последовательности аминокислот в белках («секвенирования белков») в автоматическом режиме. С этим решением мы уже ознакомились. Собственно говоря, новым в их методе был только способ автоматизации. Существо же этого метода было для химии тривиальным. Был найден способ последовательного отщепления по одной аминокислоте (хотя и в модифицированном виде) от конца изучаемой белковой цепи с последующей идентификацией каждого из полученных таким образом простых продуктов.
Отыскание аналогичного подхода для секвенирования ДНК не вдохновляло исследователей, поскольку для секвенирования хотя бы одного структурного гена предстояло определять последовательность в 1—3 тысячи нуклеотидов, не говоря уже о всем геноме, когда счет должен идти на миллионы, а у высших организмов на миллиарды нуклеотидов.
Первоначальные способы не автоматизированного секвенирования ДНК
В 1977 году Максам и Гилберт предложили совершенно иной, оригинальный метод решения проблемы секвенирования. Им удалось найти химическую реакцию, которая расщепляла молекулу ДНК по месту расположения одного определенного нуклеотида. Они помечали радиоактивной меткой первый нуклеотид исследуемого однонитевого (после денатурации) фрагмента ДНК, представленного, разумеется, огромным количеством копий. Затем проводили реакцию расщепления в таких условиях, что подавляющее большинство нитей ДНК разрывалось только в одном из множества мест, где стоял избранный нуклеотид (а все эти места равноправны). После этого продукты расщепления направлялись для анализа методом электрофореза в ПААГ. Ауторадиография геля выявляла следующую картину.
Отрезки ДНК всех возможных размеров, считая от начала молекулы до известного (подвергшегося химической атаке) нуклеотида, разделились и обнаружили себя полосами почернения рентгеновской пленки. Самые короткие отрезки (в 2, 3 и даже один первый нуклеотид) ушли в геле далеко вперед. Более длинные отрезки отстали тем сильнее, чем они были длиннее. Степень почернения полос оказалась разная, поскольку число молекул ДНК, разорвавшихся в каждом из возможных мест было случайным. Но при достаточном количестве исходного материала все они были хорошо видны. «Отрезанные» части молекул, напротив, ничем себя в геле не проявляли, так как не содержали меченого нуклеотида.
Эта картина еще не несла в себе никакой информации о порядковых номерах нуклеотидов, по которым произошел разрыв. Однако аналогичные специфические реакции расщепления авторам удалось найти и для трех остальных нуклеотидов. Они смогли получить соответствующие картины разделения отрезков ДНК и для них. Затем они вели электрофоретическое разделение одновременно для всех 4-х случаев в параллельных треках одного геля. Из сопоставления положений всех полос оказалось возможным получить полную информацию о последовательности нуклеотидов в исследуемом фрагменте ДНК. Действительно, все полосы в 4-х треках должны находиться на разных уровнях, потому что длины соответствующих этим полосам отрезков ДНК будут различаться между собой хотя бы на один нуклеотид. Вместе с тем, ничего другого, кроме четырех нуклеотидов, в ДНК нет. Это означает, что совокупность всех отрезков дискретно исчерпывает все возможные удаления от начала молекулы. А следовательно, пронумеровав все полосы в геле, начиная с самой удаленной от старта, совокупно по всем четырем трекам можно получить всю нуклеотидную последовательность секвенируемого фрагмента ДНК.
Ауторадиография — метод регистрации положения радиоактивно-меченых веществ в геле путем фиксации их излучения на рентгеновской пленке. Ведь каждому номеру, оказавшемуся в любом из треков, будет соответствовать заранее известный нуклеотид, определивший место разрыва ДНК при подготовке препарата именно для этого трека.
Отметим, что метод Максама и Гилберта позволяет определить всю последовательность, начиная- с первого нуклеотида. Но представляет немалые трудности в трактовке результатов эксперимента. Ведь он требует уверенного определения чередования полос, находящихся в разных треках. В частности, и таких полос, которые соответствуют отрезкам ДНК длиною в несколько десятков, а то и сотен нуклеотидов с отличием в один нуклеотид. Между тем условия подготовки препаратов, да и самого электрофореза (например, условия теплоотвода) могут быть чуть-чуть разными для разных треков и это может спутать всю картину определения последовательности. Особенно в верхних частях пластины геля, где тесно сдвинуты полосы, соответствующие длинным отрезкам. По этой причине метод Максама и Гилберта не позволял секвенировать фрагменты ДНК крупнее, чем 200-300 нуклеотидных звеньев. Кроме того, он не поддавался автоматизации.
В том же 1977 году (чуть позже) Сенджер и сотр. предложили другой метод секвенирования ДНК. В принципе, он был во многом аналогичен описанному выше методу. Здесь тоже удавалось получить четыре набора отрезков ДНК всех возможных размеров, радиоактивно меченых и заканчивающихся на одном из четырех нуклеотидов. Их точно так же разделяли электрофорезом в 4-х параллельных треках ПААГ, получали четыре «лестницы» полос почернения после ауторадиографии и совокупным анализом последовательности полос в них устанавливали последовательность нуклеотидов в исследуемом фрагменте ДНК. Впрочем, не совсем всю последовательность. Первые несколько нуклеотидов при этом могли остаться не определенными по причине, которая станет ясна из дальнейшего.
Обратимся теперь к тому в чем два метода существенно различались между собой. А именно, к способу получения отрезков ДНК всех возможных размеров, оканчивающихся на любой из 4-х нуклеотидов. Напомню, что Максам и Гилберт радиоактивно метили первый нуклеотид последовательности и химическим способом расщепляли исследуемый однонитевой фрагмент ДНК по всем местам нахождения каждого из нуклеотидов.
Сенджер и сотр. предложили использовать тот же однонитевой фрагмент ДНК в качестве матрицы для комплементарного синтеза по ней с помощью ДНК-полимеразы I множества неполных копий всех возможных размеров, оканчивающихся на определенном нуклеотиде. Для этого избранный нукле-отид должен был быть модифицирован таким образом, чтобы «не потеряв своего лица» быть включенным в растущую комплементарную цепь ДНК и . тем самым прекратить ее рост, фиксируя размер скопированного участка матрицы. Чтобы получить отрезки ДНК всех возможных в этом случае размеров, модифицированный нуклеотид должен быть примешан к смеси четырех нормальных нуклеозидтрифосфатов — предшественников биосинтеза ДНК тоже в виде нуклеозидтрифосфата, но в таком малом количестве, чтобы остановка синтеза при случайном его включении происходила с одинаковой вероятностью в любом месте синтезируемой копии.
Очевидно, что именно с этим модифицированным нуклеотидом следует связать радиоактивную метку, чтобы локализовать определенный им отрезок ДНК на рентгеновской пленке после ауторадиографии. Но что же это за модификация? В какой части нуклеотида она может иметь место? Очевидно, что не в самом нуклеиновом основании. Ведь для того, чтобы быть «узнанным» ДНК-полимеразой и комплементарно включенным в растущую цепь ДНК-копии нуклеотид должен «сохранить свое лицо». Значит модификация должна коснуться дезоксирибозы. Тем более, что именно она участвует в построении сахаро-фосфатной связи между нуклеотидами, то есть в самом процессе наращивания полинуклеотидной цепочки.