• Что такое генетический код и как он был расшифрован?.Вокруг Света. Украина
    Фото: Getty Images
    Наука
    Четверг, 21 января 2021

    Что такое генетический код и как он был расшифрован?

    Генетический код - это “язык программирования” для передачи наследственной информации.

     Хотя генетика — невероятно сложная наука, генетический код как раз довольно прост для понимания, его изучают в девятом классе на уроках биологии и потом благополучно забывают.

    Что такое генетический код?

    Генетический код — это правила, по которым последовательность аминокислот в белке кодируется молекулой матричной РНК. 

    Белок — это молекула, состоящая из цепочки аминокислот, соединенных пептидной связью. Всего известно около 60 аминокислот, но в большинстве белков используются 20 так называемых стандартных аминокислот. 

    Свойства белков зависят от того, какие аминокислоты, в каком количестве и в какой последовательности входят в их состав. Скажем, антитела к различным вирусам, инсулин, альбумин (яичный белок), гемоглобин, многие ферменты, основа клеточной мембраны — все это белки, но очень разные. 

    ДНК и РНК — молекулы, состоящие из цепочки нуклеотидов (нуклеиновых кислот). Всего существует пять нуклеотидов: аденин, гуанин, цитозин,тимин и урацил. Первые три присутствуют и в ДНК и в РНК. Тимин и урацил — это похожие по составу нуклеотиды, тимин присутствует только в ДНК, урацил — только в РНК. 

    В ДНК последовательностью нуклеотидов зашифрована генетическая информация о составе всех белков, необходимых конкретному организму. РНК эту информацию считывает и передает “инструкцию” непосредственно на место синтеза белка, в рибосому. В каждой из примерно 10 млрд человеческих клеток постоянно работает заводик по производству белков — без перерыва и отпуска.

    Схема в общих чертах выглядит так: в ядре клетки постоянно формируется слепок ДНК — молекула матричной РНК. Каждому из четырех нуклеотидов-”кирпичиков” ДНК соответствует определенный нуклеотид мРНК — они комплементарны, то есть дополняют друг друга, как ключ и замок. Аденин соединяется с урацилом\тимином, цитозин с гуанином. Нуклеотиды обозначаются первыми буквами названий, чаще латинскими. Процесс создания “слепка” называется транскрипцией. Он происходит непрерывно.

    Готовая молекула матричной РНК отделяется от ДНК и попадает из ядра в рибосому. Молекулы транспортной РНК тащат к ней, как к конвейеру, необходимые аминокислоты. Эти аминокислоты в рибосоме соединяются в цепочку по инструкции, считанной с матричной РНК: каждую аминокислоту кодирует тройка (триплет) нуклеотидов мРНК, стоящих в определенном порядке (скажем, GGU, AGU, CUA и т.д). Процесс сборки белка называется трансляцией. 

    Соответствие между триплетами нуклеотидов и конкретными аминокислотами — это генетический код. 

    Свойства генетического кода

    Практически всегда и у всех организмов на Земле соответствие между триплетами нуклеотидов и конкретными аминокислотами одинаковое — это свойство называют универсальностью генетического кода. Генетический код универсален для всех, от цианобактерий до человека. Это лишний раз напоминает о том, что мы с цианобактериями хоть и далекие, но родственники.

    Однако в некоторых случаях генетический код все-таки немного видоизменяется, в частности, при синтезе белков в митохондриях. 

    Специфичность генетического кода состоит в том, что каждому триплету-кодону соответствует только одна аминокислота. Например, триплет AUG кодирует только аминокислоту метионин; триплет CAC — только гистидин; UAU — только тирозин. 

    Однако вариантов тройных комбинаций из четырех нуклеотидов существует 43 = 64. А аминокислот в белках — всего 20. Поэтому природа устроила так, что каждую аминокислоту кодируют несколько триплетов. Скажем, аминокислоту аланин можно закодировать четырьмя кодонами:  GCU, GCA, GCC, GCG (все начинаются с GC). А лейцин — аж семью кодонами, из них четыре начинаются с CU. Это свойство называется избыточностью генетического кода. Оно выполняет важную роль: предупреждает ошибки и поломки в системе. Когда в ДНК есть мутация, матричная РНК тоже копирует эту ошибку. Но если мутация точечная, то есть лишь один нуклеотид в триплете неправильный, то благодаря избыточности генетического кода есть шанс, что триплет все равно закодирует нужную аминокислоту. 

    Сейчас установлены многие мутации, приводящие к наследственным заболеваниям. Например, из-за перестройки в Х-хромосоме в организме перестает вырабатываться белок под названием «фактор VIII». Этот белок необходим для сворачивания крови и формирования сгустка на ране. Болезнь известна как гемофилия. Более мелкие, точечные мутации приводят к талассемии, серповидной анемии, муковисцидозу и другим наследственным заболеваниям.

    Есть и другие болезни, о наследственном происхождении которых генетики пока только строят предположения, — например, синдром Туретта. Возможно, в будущем удастся найти мутацию или, скорее, набор мутаций, ответственных за его возникновение.

    Непрерывность генетического кода

    Между отдельными триплетами матричной РНК никакого разграничения нет. Поэтому в синтезе белка окончание одного триплета автоматически означает начало следующего. Отсюда еще два свойства генетического кода: непрерывность и неперекрываемость. Непрерывность генетического кода — это считывание кодонов без промежутков, один за другим. Неперекрываемость генетического кода означает, что каждый нуклеотид может входить в состав только одного триплета. Если триплеты GUA и CCG выстроены в непрерывную цепочку, то A не может быть частью триплета ACC — поскольку триплеты не перекрываются. 

    Помимо смысловых кодонов, существуют кодоны, которые означают начало и конец белковой молекулы: UAA, UAG, UGA. В огромном большинстве случаев эти кодоны служат только сигнальными флажками, знаками препинания в закодированной фразе. Но есть исключения: в митохондриях, а также у инфузорий и зеленых водорослей триплеты UAA, UAG, UGA могут служить еще и смысловыми кодонами. Как рибосома “понимает” разницу? Этот вопрос не до конца решен, но считается, что значение стоп-кодонов зависит от положения в молекуле мРНК: если они попадаются в середине, значит, смысловые; если близко к концу молекулы РНК — рибосома воспринимает их как стоп-кодоны.

    Таблица генетического кода

    Благодаря таким жестким закономерностям генетический код легко складывается в таблицу.

    таблица генетического кода

    Расшифровка генетического кода

    Как только в 1953 году Крик и Уотсон на основании данных Франклин и Уилкинса открыли структуру двойной спирали ДНК, ученые задались вопросом, как именно ДНК кодирует  последовательность аминокислотніх остатков в белке. Первым предложил идею триплетов Георгий Гамов, американский физик русского происхождения. Гамов не занимался биологией — он просто заметил, что для кодирования 20 аминокислот достаточно 64 комбинаций, возникающих при сочетании четырех нуклеотидов тройками. 

    В 1961 году эту гениальную в своей элегантной простоте идею подтвердили экспериментально. Американский биохимик Маршалл Ниренберг с коллегами провел эксперимент по синтезу белка (точнее, пептида) в пробирке, in vitro. В качестве матрицы взяли синтетический олигонуклеотид — нуклеиновую кислоту, состоящую только из урацила, и поместили ее в “подопытного кролика” — кишечную палочку E. Coli. Бактерия начала прилежно синтезировать белок на искусственной матрице. В результате получился полипептид, содержавший только аминокислоту фенилаланин. Так впервые было установлено значение триплета-кодона: кодон UUU кодирует фенилаланин. 

    Дальнейшие эксперименты проводились с синтетической РНК, содержащей только аденин, только цитозин, а затем — разные комбинации нклеотидов. Большинство кодонов расшифровал индийский биохимик Хар Гобинд Корана. А американский биохимик Роберт Холли описал структуру матричной РНК. В 1968 году эти трое ученых — Ниренберг, Корана и Холли — получили Нобелевскую премию по физиологии и медицине за вклад в расшифровку генетического кода. 

    Читайте также:

    Генетики расшифровали геном саблезубой кошки

    Анализ ДНК показал, что коренных жителей Карибского региона уничтожили еще до Колумба