Ромбический код Гамова обладает еще одним особым свойством: он является перекрывающимся кодом, в том смысле, что каждое нуклеотидное основание входит одновременно в три кодона. Так, последовательность AGTCTTG состоит из кодонов AGTCTTG, A GTCTTG, AG TCTTG, AGT CTTG и AGTC TTG. Перекрывающийся код очень эффективен и компактен, что, казалось бы, делает его для Природы привлекательным кандидатом на занятие должности. У Природы, однако, были иные идеи. Одна из проблем, создаваемых перекрывающимся кодом, состоит в том, что многие аминокислотные последовательности оказываются вне игры. Например, предположим, что мы хотим закодировать дипептид, очень маленький белок, состоящий из двух аминокислот. Его образцом является заменитель сахара аспартам, комбинация слегка модифицированных форм двух аминокислот, аспарагиновой кислоты и фенилаланина. Поскольку существуют двадцать естественно образующихся аминокислот, существует 20×20=400 возможных дипептидов. Чтобы закодировать две аминокислоты перекрывающимся кодом, необходимы четыре основания, например, CCGA, чтобы получить CCGA для аминокислоты пролина (которую означает данный триплет) и C CGAдля аргинина. Но существует всего 4×4×4×4=256 возможных комбинаций из четырех нуклеотидных оснований, поэтому многие дипептиды не могут быть закодированы (аспартам является одним из них). Однако эти запрещенные комбинации начинают обнаруживать, а это показывает, что Природа не использует элегантность перекрывающегося кода: она требует большей гибкости для своих действий в непрекращающейся взыскательной игре эволюции. Сидни Бреннер (р. 1927) осуществил исчерпывающий анализ этой проблемы: он показал, что все возможные перекрывающиеся коды не совместимы с известными последовательностями аминокислот. Другим, даже более заметным гвоздем в этом, теперь уже плотно заколоченном, гробу явился тот факт, что изменение одной буквы может изменить состав белка сразу на три аминокислоты. Действительно, если бы цепочка AGTCTTG подверглась мутации AGGCTTG, то она состояла бы из кодонов AGGCTTG, A GGCTTG, AG GCTTG и так далее, возможно, со зловещими последствиями для белка и организма, который часто не может пережить замены даже одного основания.
Существовал еще один тупиковый путь среди экономичных и элегантных идей, к которым так благосклонны умозрительные физики и которые Природа с презрением отвергает. Это была проблема пунктуации. Как мы можем узнать, где начало? Даже в неперекрывающемся коде …AGTCTTG… возможны разночтения …(AGT)(CTT)(G…, …A)(GTC)(TTG)…, …AG)(TCT)(TG… и так далее. Различные выборы, представленные этими примерами, называются чтением кода скользящим окном . Крик предположил, что в клетке существуют механизмы только для определенных кодонов и что код должен быть таким, чтобы чтение скользящим окном приводило к чепухе. Предположим, что в приведенном примере правильным прочтением является …(AGT)(CTT)(G…, тогда AGT и CTT были бы подходящими кодонами, а чтение скользящим окном GTC и TCT было бы чепухой. Коды такого рода называются кодами без запятых , поскольку их можно однозначно прочесть без пунктуации. Если, имея в виду это ограничение, исследовать шестьдесят четыре кандидата в кодоны, оказывается, что легитимными могут быть только двадцать, в точности число, которое предполагалось и требовалось. Например, ТТТ не подходит, поскольку комбинация …TTTTTT… содержит неоднозначность, допускающую чтение скользящим окном: …(TTT)(TTT)… и …T)(TTT)(TT…. А раз оказалось, что этот код обеспечивает требуемое число кодонов и позволяет избежать проблемы чтения скользящим окном, он был немедленно и всеми принят.
Но только не Природой. Она раздавила своей пятой и этот вид неограниченного умозрения и остановила дальнейшее расточение пышных фантазий в 1961 г. Акт раздавливания зарегистрировали Маршалл Ниренберг и Генрих Маттей, которые показали, что TTT является вполне пригодным кодоном и что он означает фенилаланин. Так элегантный и экономный код без запятых был обращен в пыль.
Оказалось, что Природа блефовала в своей обычной бессознательной и непреднамеренно коварной манере. Она произвела самый простой код из всех возможных, не заботясь об избыточности и не обращая особого внимания на проблему чтения кода скользящим окном. Настоящий генетический код, который постепенно был собран по кусочкам в 1960-е гг., существенно избыточен, в нем до шести кодонов могут соответствовать одной и той же аминокислоте и три означают остановку (рис. 2.11). Как можно видеть задним числом, избыточность является очень умным ходом, поскольку уменьшает вероятность того, что «ошибки» копирования будут иметь фатальные последствия. Например, каждая из групп CCT, CCC, CCA и CCG кодирует пролин, так, что ошибки в последней букве не важны. Даже когда изменение одной буквы является значимым, результатом этого часто является замена одной аминокислоты на другую, ей подобную. К примеру, замена TTT на TAT приводит к замещению фенилаланина его кузеном тирозином. Код является в этом отношении почти оптимальным. В результате, поскольку все шестьдесят четыре кодона являются жизнеспособными, Природа имеет пространство для вариаций и экспериментов, как нам уже доводилось отмечать выше.
Читать дальше