Протеомика
Наш рассказ будет посвящен одной из самых молодых фундаментальных наук (если не самой молодой), которая родилась всего лишь несколько лет назад вместе с теми, кто еще сейчас учится в начальной школе. В отличие от многих других наук о протеомике можно точно сказать, при каких обстоятельствах она возникла, указать год, когда появилось ее название и кто его придумал.
Начнем с обстоятельств. Во второй половине XX в. бурно развивались аналитические методы биохимии, молекулярной биологии и вычислительной техники. Выдающиеся успехи, достигнутые в этих областях, привели к возможности расшифровки огромных последовательностей оснований нуклеиновых кислот и к записи полного генома живого организма. Впервые полный геном был расшифрован в 1980 г. [1] у бактериофага phi Х-174 (около 5·103 оснований), затем у первой бактерии – Haemophilus influenzae (1, 8·106 оснований) [2]. А c завершением XX в. была закончена грандиозная работа по расшифровке полного генома человека – выявлению последовательности примерно 3 млрд оснований нуклеиновых кислот [3]. На эту работу было затрачено несколько миллиардов долларов (примерно по одному доллару на одно основание). Всего же уже расшифрованы геномы нескольких десятков видов живых организмов. Именно в этот период возникли две новые биологические науки: в 1987 г. впервые в научной печати было использовано слово «геномика» [4], а в 1993 г. – «биоинформатика» [5].
У каждого биологического вида часть генома представлена участками, кодирующими аминокислотные последовательности белков. Например, таких участков у человека насчитывается порядка 100 000 (по некоторым оценкам, это число может достигать 300 000, а с учетом химически модифицированных структур – нескольких миллионов). Казалось бы, зная полный геном и генетический код, можно путем трансляции получить все сведения о структуре белков. Однако все не так просто. Постепенно становилось очевидным, что в данной рассматриваемой клеточной системе организма нет корреляции между наборами мРНК и белков. Кроме того, многие белки, синтезированные на рибосомах в соответствии с нуклеотидной последовательностью, после синтеза подвергаются химическим модификациям и могут существовать в организме в модифицированной и немодифицированной формах. И еще немаловажно то, что белки обладают разнообразными пространственными структурами, которые на сегодняшний день нельзя определить по линейным последовательностям нуклеотидов и даже аминокислот. Поэтому прямое выделение и определение структур всех функционирующих белков остается по-прежнему актуальной задачей (прямое определение структуры на сегодняшний день осуществлено примерно лишь для 10% белков человека). Так, в дополнение к геномике появился термин «протеомика», объектом исследования которой является протеом (от англ. PROTEins – белки и genOMe – геном). А в научной печати упоминание о протеоме впервые появилось в 1995 г. [6].
Следует добавить, что большую роль в жизнедеятельности организмов играют многочисленные короткие фрагменты белковых предшественников, которые называются олигопептидами, или просто пептидами. Именно из-за них наблюдается такой разнобой в оценке количества белково-пептидных компонентов у представителей одного биологического вида. Поэтому наряду с терминами «протеом» и «протеомика» в настоящее время уже употребляются такие термины, как «пептидом» и «пептидомика», представляющие собой часть протеома и протеомики. О многообразии структуры и функций белков и пептидов на страницах газеты «Биология» нами было рассказано ранее [7].
Итак, сформулируем определения новых наук, которые появились при жизни нынешнего молодого поколения и которые тесно взаимосвязаны друг с другом (рис. 1).
Рис. 1. Схема, иллюстрирующая полную взаимосвязь трех новых биологических наук
Геномика – наука, занимающаяся изучением структуры и функций генов (геном – совокупность всех генов организма).
Биоинформатика – наука, занимающаяся изучением биологической информации с помощью математических, статистических и компьютерных методов.
Протеомика – наука, занимающаяся изучением совокупности белков и их взаимодействий в живых организмах (протеом – совокупность всех белков организма).
Отметим также, что протеомика в общих чертах включает в себя структурную протеомику, функциональную протеомику и прикладную протеомику, которые мы рассмотрим в отдельности.
Структурная протеомика
Наиболее яркой особенностью биологии является разнообразие. Оно просматривается на всех уровнях биологической организации (биологические виды, морфология, химическая структура молекул, сеть регуляторных процессов и т.д.). В полной мере это относится и к белкам. Масштаб их структурного разнообразия до сих пор до конца не выявлен. Достаточно сказать, что число аминокислотных остатков в одном белке может составлять от двух (минимальная структура, имеющая пептидную связь) до десятков тысяч, а белок титин человека содержит 34 350 аминокислотных остатков и на сегодняшний день является рекордсменом – самой крупной из всех известных белковых молекул.
Чтобы получить сведения о протеоме, необходимо сначала его выделить и очистить от других молекул. Поскольку число белков во всем протеоме (т.е. во всем организме) весьма велико, обычно берут только часть организма (его орган или ткань) и различными методами выделяют белковую компоненту. За почти 200-летнюю историю изучения белков разработано множество методов выделения белков – от простого солевого осаждения до современных сложных методов, учитывающих различные физические и химические свойства этих веществ. После получения чистой фракции индивидуального белка определяется его химическая структура.
В структурной протеомике проводится определение структуры не одного, а сразу множества белков, и к настоящему времени для этого разработан специальный цикл процедур и создан арсенал соответствующих высокоточных приборов. (Полный набор оборудования для протеомных исследований стоит более одного миллиона долларов.)
Рис. 2. Инструменты протеомики
На рис. 2 приведена схема лабораторного цикла от приготовления образца до определения его структуры. После выделения и очистки (на рисунке представлен уже выделенный и очищенный препарат) с помощью двумерного электрофореза проводится разделение белков. Это разделение идет по двум направлениям: в одном разделяются молекулы белка, имеющие разную массу, в другом – различный суммарный электрический заряд. В результате этой тончайшей процедуры на специальном носителе одинаковые молекулы группируются, образуя макроскопические пятна, причем в каждом пятне содержатся только одинаковые молекулы. Число пятен, т.е. число разных белков или пептидов, может составлять многие тысячи (рис. 3, 4), и для их исследования используются автоматические устройства для обработки и анализа. Затем проводится отбор пятен и введение содержащихся в них веществ в сложнейший физический прибор – масс-спектрометр, с помощью которого и определяется химическая (первичная) структура каждого белка.