Секвенирование дезоксирибонуклеиновой кислоты (ДНК)
Обратимся к рисункам 24, 25 и 26 на стр. 34 и 35. Рассматривая их, нетрудно вспомнить, что связь между соседними нуклеотидами образуется за счет ферментативного отщепления воды от ОН-группы, которой заканчивается остаток фосфорной кислоты в одном нуклеотиде (этот остаток присоединен в 5'-положении «своей» дизоксирибозы) и ОН-группы, присоединенной в 3'-положении к дезоксирибозе его партнера по связи. Между этими двумя положениями и устанавливается фосфорнодиэфирная связь.
Сама дезоксирибоза, как видно из сравнения двух Сахаров на рис. 24, получила свое наименование в связи с тем, что у нее на одну ОН-группу меньше, чем у рибозы. Если для получения нужного нам модифицированного нуклеотида использовать сахар, у которого вместо ОН-группы в 3'-положении стоит просто Н, то такой сахар можно назвать «дидезоксирибозой», и полное название соответствующего ему нуклеотида будет «дидезоксирибонуклеотид». Когда ДНК-полимераза включит в синтезируемую нить ДНК, в соответствии с условием комплементарности, дидезоксирибонуклеотид (а она это сделает «не заметив» подмены), то дальнейшее наращивание нити ДНК-копии прекратится, так как не будет одной из двух ОН-групп, участвующих в образовании сахаро-фосфатной связи.
Описанную процедуру авторы метода сумели повторить и с остальными тремя дидезоксирибонуклеотидами. После чего провели электрофорез продуктов четырех реакций в четырех параллельных треках ПААГ и совокупный анализ результатов разделения как в методе Максама и Гилберта. Первое время оба метода были равноправны. В методе Сенджера и сотр. было то преимущество, что он допускал большую загрузку геля при электрофорезе так как в нем нет невидимых отщепленных «хвостов» ДНК, загружающих полосы меченых отрезков такой же длины. С другой стороны, недостатком метода была необходимость посадки прай-мера на начало копируемой ДНК, от которого только и могла начать работать ДНК-полимераза I. Праймер нетрудно было синтезировать искусственно, но для этого надо было уже знать некоторую начальную последовательность нуклеотидов в секвенируемом фрагменте ДНК. Разумеется, сам праймер входил в состав всех отрезков ДНК, разделенных электрофорезом. Но если он был точно комплементарен началу матрицы, то это не мешало ее полному секвенированию. Само секвенирование начиналось с первого нуклеотида после праймера. Заметим на всякий случай, что выяснив последовательность нуклеотидов в синтезируемой нити ДНК мы узнаем, в силу комплементарности, последовательность и в самой исходной нити ДНК.
Что же касается трудности однозначного прочтения последовательности ДНК на основе совокупного рассмотрения полос в четырех треках, то она в методе Сенджера оставалась такой же, как зв методе Максама и Гилберта. Однако метод Сенджера и сотр. открыл перспективу автоматизации трудоемкого процесса секвенирования ДНК, и этим был совершен скачок в развитии молекулярной биологии.
Автоматическое секвенирование (принцип)
Переход к автоматическому секвенированию требовал в первую очередь проведения электрофореза всех четырех семейств отрезков ДНК в одном треке. Как уже отмечалось, установление относительного расположения четырех полос, расположенных в разных треках и отличающихся по длине всего на один нуклеотид, затруднительно. Логика визуальной оценки ситуации человеком может ввести коррективы в указанную ранее возможность неодинаковости условий разделения в разных треках. Наверное, этой логике можно « обучить « и компьютер, но это сильно усложнит его программу и ее надежность трудно предсказать.
Между тем в обоих методах переход к электрофорезу в одном треке с использованием радиоактивной метки невозможен. Для идентификации значения каждой полосы потребовалось бы четыре различных радиоактивных изотопа. Допустим, что это были бы доступные для биологических применений ^^ 14C, ^S и 32?. Различие этих изотопов может проявить себя только в степени почернения рентгеновской пленки. Но, во-первых, энергия р-излучения двух из этих изотопов (^С и ^S) почти одинаковы, а, во-вторых, степень почернения будет зависеть еще от одного, вовсе неизвестного фактора — количества отрезков ДНК, оказавшихся случайно одинаковыми по длине и потому суммирующих свое излучение в одной полосе. (Не забудем, что исходно для секвенирования мы имеем не один, а великое множество одинаковых фрагментов ДНК, независимо друг от друга копируемых в условиях случайных обрывов этого процесса.)
Разрешение проблемы было найдено использованием для идентификации полос в геле флюоресценции вместо радиоактивности. На основе дихлорородамина были разработаны четыре флюоресцентных красителя разных цветов, с максимами излучения при 544, 569, 597 и 622 тц, лежащими в зеленой, желто-зеленой, оранжевой и красной областях спектра и легко разделимыми в спектрофотометре. Авторам удалось связать эти красители с четырьмя дидезоксирибонуклетидами. Таким образом при лазерном облучении геля каждая полоса в методе Сенджера при электрофорезе в одном треке заявляла о своей специфичности соответствующим цветом излучения.
Разумеется, каждая полоса в геле, в силу своей конечной ширины и некой кривой распределения вещества по этой ширине, испускала свет флюоресценции тоже в виде некоего колоколообразного пика интенсивности света, растянутого в направлении электрофореза. В нижних своих частях эти пики могли перекрываться (как перекрывались своими границами и соответствующие полосы в геле). Но вершины пиков хорошо отделялись друг от друга, и это позволяло прямо по этим вершинам определять порядковый номер каждого нуклеотида. А его индивидуальность — по цвету пика.
Практические аспекты автоматического секвенирования
Первый вопрос, требующий прояснения — как быть с синтезом праймера, если начало секвенируемого фрагмента ДНК неизвестно. Ответа может быть два. Первый (тривиальный) — каким-то другим способом определить начальную последовательность секвенируемой ДНК. Второй — присоединить к этой ДНК, перед ее началом, с помощью естественной сахаро-фосфатной связи другую короткую, но хорошо известную последовательность нуклео-тидов. Синтезировать праймер по ней, на нее же его посадить и таким образом заставить ДНК-полимеразу считывать интересующую нас матрицу с первого нуклеотида. Оба варианта решения проблемы можно найти в уже знакомом нам материале:
1. Выяснение начальной последовательности секвенируемого фрагмента ДНК
а) Если о нем ничего неизвестно, то можно воспользоваться «устаревшим» методом Максама и Гилберта, который для первых десятков нуклеотидов достаточно быстро дает вполне надежные сведения.
б) В случае, если нас интересует секвенирование определенного гена, направляющего биосинтез вполне конкретного белка известной структуры, и если есть основание полагать, что этот ген (или хотя бы его начало) входит в состав обследуемого фрагмента ДНК. А значит и такой же длины начальную последовательность дезоксирибонуклеотидов соответствующего гена. Синтезированный праймер в этом случае просто воспроизведет расшифрованную часть иРНК.
2. Присоединение к началу секвенируемого фрагмента известной последовательности ДНК для синтеза праймера по ней.