Протеомика
Рис. 3. Пример двумерной электрофореграммы белков из экстракта печени мыши [8]
Рис. 4. Пример двумерной электрофореграммы пептидов из цереброспинальной жидкости человека [9]
Рис. 5. Нуклеотидная последовательность гена, кодирующего сывороточный альбумин человека
Первичную структуру белка можно также определить, пользуясь результатами геномики и биоинформатики. На рис. 5 дана полная структура гена сывороточного альбумина человека. Она содержит 1830 азотистых оснований, кодирующих 610 аминокислотных остатков. Этот ген, как и абсолютное большинство других, начинается с кодона atg, кодирующего остаток метионина, и заканчивается одним из стоп-кодонов, в данном случае taa. Таким образом кодируется структура, состоящая из 609 аминокислотных остатков (рис. 6). Однако эта структура – молекула еще не сывороточного альбумина, а лишь его предшественника. Первые 24 аминокислотных остатка представляют собой так называемый сигнальный пептид, который при переходе молекулы из ядра в цитоплазму отщепляется, и только после этого образуется структура сывороточного альбумина, получаемая при выделении этого белка. В итоге данная молекула содержит 385 аминокислотных остатков.
Рис. 6. Аминокислотная последовательность предшественника сывороточного альбумина человека, транслированная с нуклеотидной последовательности с помощью генетического кода
Рис. 7. Пространственная (третичная) структура молекулы сывороточного альбумина человека
Однако аминокислотная последовательность не раскрывает пространственную структуру белка. С точки зрения термодинамики, вытянутая линейная структура энергетически невыгодна, и поэтому она специфическим для каждой последовательности образом сворачивается в уникальную пространственную структуру, которая может быть определена с помощью двух мощных физических методов – рентгеноструктурного анализа и метода ядерного магнитного резонанса (ЯМР-спектроскопии). С помощью первого из них определены пространственные структуры уже нескольких тысяч белков, в том числе и сывороточного альбумина человека, изображение которого представлено на рис. 7. Эта структура, в отличие от первичной (аминокислотной последовательности), называется третичной и в ней хорошо видны спирализованные участки, являющиеся элементами вторичной структуры.
Таким образом, задача структурной протеомики сводится к выделению, очистке, определению первичной, вторичной и третичной структур всех белков живого организма, а ее основными средствами являются двумерный электрофорез, масс-спектрометрия и биоинформатика.
Биоинформатика белков
Существование огромного количества разнообразных белков привело к необходимости создания информационных массивов – баз (или банков) данных, в которые заносились бы все известные о них сведения. В настоящее время существует множество общих и специализированных баз данных, которые доступны в Интернете каждому желающему. В общих базах содержатся сведения о всех известных белках живых организмов, т.е. о глобальном протеоме всего живого. Примером такой базы является SwissProt-TrEMBL (Швейцария–Германия), в которой на сегодняшний день содержатся структуры почти 200 000 белков, установленные аналитическими методами, и еще почти 2 млн структур, которые определены в результате трансляции с нуклеотидных последовательностей [10]. На рис. 8 и 9 показано количество существующих белков, которые известны для каждого заданного числа аминокислотных остатков. Оси абсцисс на этих графиках ограничены 2000 остатков, но, как уже сказано выше, хотя и не часто, но встречаются и существенно более крупные молекулы. Из данных, представленных на рисунках, следует, что наибольшее число белков содержит по несколько сотен аминокислотных остатков. К ним относятся ферменты и другие достаточно мобильные молекулы. Среди более крупных белков много таких, которые выполняют опорную или защитную функции, скрепляя биологические структуры и придавая им прочность.
Рис. 8. Распределение известных (выделенных) белков по числу аминокислотных остатков
Рис. 9. Распределение транслированных аминокислотных последовательностей по числу минокислотных остатков
Рис. 10. Распределение известных природных олигопептидов по числу аминокислотных остатков
В глобальном протеоме особое место занимают небольшие очень подвижные молекулы, содержащие не более 50 аминокислотных остатков и обладающие специфическим спектром функциональной активности. Они называются олигопептидами, или просто пептидами. Для них, т.е. для глобального пептидома, создан особый банк данных, который называется EROP-Moscow. Это название представляет собой аббревиатуру от термина Endogenous Regulatory OligoPeptides (эндогенные регуляторные олигопептиды), и указывает на то, что банк создан и базируется в столице нашей страны [11]. На сегодняшний день расшифрована структура почти 6000 олигопептидов, выделенных из представителей всех царств живого. Так же как и крупные белки, количество олигопептидов с заданным числом аминокислотных остатков можно изобразить графически (рис. 10). Судя по графику, чаще всего встречаются олигопептиды, содержащие примерно 8–10 аминокислотных остатков. Среди них в основном содержатся молекулы, которые участвуют в регуляции нервной системы, и поэтому называются нейропептидами. Очевидно, что самые быстрые процессы в живом организме осуществляются с участием нервной системы, поэтому пептидные регуляторы должны быть мобильными и следовательно небольшими. Однако, следует отметить, что, ввиду огромного структурного и функционального разнообразия как белков, так и пептидов, для них до сих пор не создано строгой классификации.