Хотя генетика — невероятно сложная наука, генетический код как раз довольно прост для понимания, его изучают в девятом классе на уроках биологии и потом благополучно забывают.
Что такое генетический код?
Генетический код — это правила, по которым последовательность аминокислот в белке кодируется молекулой матричной РНК.
Белок — это молекула, состоящая из цепочки аминокислот, соединенных пептидной связью. Всего известно около 60 аминокислот, но в большинстве белков используются 20 так называемых стандартных аминокислот.
Свойства белков зависят от того, какие аминокислоты, в каком количестве и в какой последовательности входят в их состав. Скажем, антитела к различным вирусам, инсулин, альбумин (яичный белок), гемоглобин, многие ферменты, основа клеточной мембраны — все это белки, но очень разные.
ДНК и РНК — молекулы, состоящие из цепочки нуклеотидов (нуклеиновых кислот). Всего существует пять нуклеотидов: аденин, гуанин, цитозин,тимин и урацил. Первые три присутствуют и в ДНК и в РНК. Тимин и урацил — это похожие по составу нуклеотиды, тимин присутствует только в ДНК, урацил — только в РНК.
В ДНК последовательностью нуклеотидов зашифрована генетическая информация о составе всех белков, необходимых конкретному организму. РНК эту информацию считывает и передает “инструкцию” непосредственно на место синтеза белка, в рибосому. В каждой из примерно 10 млрд человеческих клеток постоянно работает заводик по производству белков — без перерыва и отпуска.
Схема в общих чертах выглядит так: в ядре клетки постоянно формируется слепок ДНК — молекула матричной РНК. Каждому из четырех нуклеотидов-”кирпичиков” ДНК соответствует определенный нуклеотид мРНК — они комплементарны, то есть дополняют друг друга, как ключ и замок. Аденин соединяется с урацилом\тимином, цитозин с гуанином. Нуклеотиды обозначаются первыми буквами названий, чаще латинскими. Процесс создания “слепка” называется транскрипцией. Он происходит непрерывно.
Готовая молекула матричной РНК отделяется от ДНК и попадает из ядра в рибосому. Молекулы транспортной РНК тащат к ней, как к конвейеру, необходимые аминокислоты. Эти аминокислоты в рибосоме соединяются в цепочку по инструкции, считанной с матричной РНК: каждую аминокислоту кодирует тройка (триплет) нуклеотидов мРНК, стоящих в определенном порядке (скажем, GGU, AGU, CUA и т.д). Процесс сборки белка называется трансляцией.
Соответствие между триплетами нуклеотидов и конкретными аминокислотами — это генетический код.
Свойства генетического кода
Практически всегда и у всех организмов на Земле соответствие между триплетами нуклеотидов и конкретными аминокислотами одинаковое — это свойство называют универсальностью генетического кода. Генетический код универсален для всех, от цианобактерий до человека. Это лишний раз напоминает о том, что мы с цианобактериями хоть и далекие, но родственники.
Однако в некоторых случаях генетический код все-таки немного видоизменяется, в частности, при синтезе белков в митохондриях.
Специфичность генетического кода состоит в том, что каждому триплету-кодону соответствует только одна аминокислота. Например, триплет AUG кодирует только аминокислоту метионин; триплет CAC — только гистидин; UAU — только тирозин.
Однако вариантов тройных комбинаций из четырех нуклеотидов существует 43 = 64. А аминокислот в белках — всего 20. Поэтому природа устроила так, что каждую аминокислоту кодируют несколько триплетов. Скажем, аминокислоту аланин можно закодировать четырьмя кодонами: GCU, GCA, GCC, GCG (все начинаются с GC). А лейцин — аж семью кодонами, из них четыре начинаются с CU. Это свойство называется избыточностью генетического кода. Оно выполняет важную роль: предупреждает ошибки и поломки в системе. Когда в ДНК есть мутация, матричная РНК тоже копирует эту ошибку. Но если мутация точечная, то есть лишь один нуклеотид в триплете неправильный, то благодаря избыточности генетического кода есть шанс, что триплет все равно закодирует нужную аминокислоту.
Сейчас установлены многие мутации, приводящие к наследственным заболеваниям. Например, из-за перестройки в Х-хромосоме в организме перестает вырабатываться белок под названием «фактор VIII». Этот белок необходим для сворачивания крови и формирования сгустка на ране. Болезнь известна как гемофилия. Более мелкие, точечные мутации приводят к талассемии, серповидной анемии, муковисцидозу и другим наследственным заболеваниям.
Есть и другие болезни, о наследственном происхождении которых генетики пока только строят предположения, — например, синдром Туретта. Возможно, в будущем удастся найти мутацию или, скорее, набор мутаций, ответственных за его возникновение.
Непрерывность генетического кода
Между отдельными триплетами матричной РНК никакого разграничения нет. Поэтому в синтезе белка окончание одного триплета автоматически означает начало следующего. Отсюда еще два свойства генетического кода: непрерывность и неперекрываемость. Непрерывность генетического кода — это считывание кодонов без промежутков, один за другим. Неперекрываемость генетического кода означает, что каждый нуклеотид может входить в состав только одного триплета. Если триплеты GUA и CCG выстроены в непрерывную цепочку, то A не может быть частью триплета ACC — поскольку триплеты не перекрываются.
Помимо смысловых кодонов, существуют кодоны, которые означают начало и конец белковой молекулы: UAA, UAG, UGA. В огромном большинстве случаев эти кодоны служат только сигнальными флажками, знаками препинания в закодированной фразе. Но есть исключения: в митохондриях, а также у инфузорий и зеленых водорослей триплеты UAA, UAG, UGA могут служить еще и смысловыми кодонами. Как рибосома “понимает” разницу? Этот вопрос не до конца решен, но считается, что значение стоп-кодонов зависит от положения в молекуле мРНК: если они попадаются в середине, значит, смысловые; если близко к концу молекулы РНК — рибосома воспринимает их как стоп-кодоны.
Таблица генетического кода
Благодаря таким жестким закономерностям генетический код легко складывается в таблицу.
Расшифровка генетического кода
Как только в 1953 году Крик и Уотсон на основании данных Франклин и Уилкинса открыли структуру двойной спирали ДНК, ученые задались вопросом, как именно ДНК кодирует последовательность аминокислотніх остатков в белке. Первым предложил идею триплетов Георгий Гамов, американский физик русского происхождения. Гамов не занимался биологией — он просто заметил, что для кодирования 20 аминокислот достаточно 64 комбинаций, возникающих при сочетании четырех нуклеотидов тройками.
В 1961 году эту гениальную в своей элегантной простоте идею подтвердили экспериментально. Американский биохимик Маршалл Ниренберг с коллегами провел эксперимент по синтезу белка (точнее, пептида) в пробирке, in vitro. В качестве матрицы взяли синтетический олигонуклеотид — нуклеиновую кислоту, состоящую только из урацила, и поместили ее в “подопытного кролика” — кишечную палочку E. Coli. Бактерия начала прилежно синтезировать белок на искусственной матрице. В результате получился полипептид, содержавший только аминокислоту фенилаланин. Так впервые было установлено значение триплета-кодона: кодон UUU кодирует фенилаланин.
Дальнейшие эксперименты проводились с синтетической РНК, содержащей только аденин, только цитозин, а затем — разные комбинации нклеотидов. Большинство кодонов расшифровал индийский биохимик Хар Гобинд Корана. А американский биохимик Роберт Холли описал структуру матричной РНК. В 1968 году эти трое ученых — Ниренберг, Корана и Холли — получили Нобелевскую премию по физиологии и медицине за вклад в расшифровку генетического кода.
Читайте также:
Генетики расшифровали геном саблезубой кошки
Анализ ДНК показал, что коренных жителей Карибского региона уничтожили еще до Колумба