Однією з головних подій, що, мабуть, сталися на початку еволюції живих організмів, стало збільшення числа генів, які беруть участь у такій співпраці. Бактерії сьогодні мають значно менше генів, аніж тварини та рослини. Це збільшення могло відбуватися шляхом різноманітних типів дуплікації генів. Згадайте, що ген є лише послідовністю закодованих символів на кшталт файлу на комп’ютерному диску і гени можуть копіюватися в різні частини хромосом так само, як файли можуть копіюватися в різні частини диска. На жорсткому диску мого комп’ютера, де зберігається цей розділ, формально існують лише три файли. Під словом «формально» я маю на увазі, що операційна система комп’ютера говорить мені, що там є лише три файли. Я можу попросити її прочитати один із цих трьох файлів, і вона представить мені лінійний масив алфавітних символів включно з тими, які ви зараз читаєте. На вигляд усе це дуже охайно й упорядковано. Але фактично на самому диску компоновка тексту є аж ніяк не охайною й не впорядкованою. Це можна побачити, якщо відійти від дисципліни формальної операційної системи комп’ютера та написати свої власні приватні програми для розшифровування того, що насправді записано в кожному секторі диска. Виявляється, що фрагменти кожного з моїх трьох файлів хаотично розкидані, перешаровані між собою та з фрагментами старих неактивних файлів, які я давно вже видалив і забув. Будь-який конкретний фрагмент може виявитись (абсолютно однаковим чи з незначними відмінностями) в півдюжині різних місць по всьому диску.
Причина цього цікава й варта окремого розгляду, бо пропонує гарну генетичну аналогію. Коли ви наказуєте комп’ютеру видалити якийсь файл, здається, що він вас слухається. Але насправді він не стирає текст цього файлу. Він просто вилучає всі вказівники на цей файл. Це так, неначе бібліотекар, якому наказали знищити «Коханця леді Чаттерлей», просто порвав би картку з каталогу, залишивши саму книжку спокійно стояти на полиці. Для комп’ютера це просто ідеально економічний спосіб дій, бо одразу ж після видалення вказівників на старий файл місце, яке раніше займав «видалений», стає автоматично доступним для запису нових файлів. По суті, перейматися тим, щоб заповнити це місце пробілами, було б марнуванням часу. Сам же старий файл не буде втрачений остаточно, допоки все його місце розташування не буде використано для зберігання нових файлів.
Але таке перевикористання місця здійснюється частинами. Нові файли не є точно такими самими за розмірами, як старі. Коли комп’ютер намагається зберегти на диску якийсь новий файл, то шукає перший-ліпший придатний для цього фрагмент, записує туди стільки нового файлу, скільки влізе, потім шукає інший доступний фрагмент, записує ще трохи, і т. д., допоки весь файл не буде записаний десь на диску. У людини складається ілюзорне враження, що файл є цілісним, упорядкованим масивом, лише тому, що комп’ютер акуратно зберігає записи, що «вказують» на адреси всіх розкиданих фрагментів. Ці «вказівники» схожі на рядки внизу газетної шпальти: «Продовження на сторінці такій-то». Причиною того, що на диску можна знайти так багато копій якогось фрагмента тексту, є те, що, якби, подібно до всіх моїх розділів, цей текст редагувався та перередаговувався багато десятків разів, кожне редагування приводило б до нового збереження на диску (майже) такого самого тексту. Зберігатися взагалі може на перший погляд той самий файл. Але як ми вже бачили, фактично текст буде неодноразово розкиданий по доступних «порожніх місцях» на диску. Відповідно, множинні копії конкретного фрагмента тексту можна знайти на всій поверхні диска, причому що старіший диск і що довше він використовується, то їх більше.
Якщо ж брати ДНК якогось виду, то вона має насправді дуже й дуже стару операційну систему, і існують докази того, що в довгостроковій перспективі вона працює трохи подібно до комп’ютера з його файлами на диску. Частина цих доказів походить від захопливого феномену «інтронів» і «екзонів». За останнє десятиліття було відкрито, що будь-який «єдиний» ген (мається на увазі єдиний уривок тексту ДНК, що читається безперервно) не зберігається весь в одному місці. Якщо читати літери коду так, як вони розміщені вздовж хромосоми (тобто якщо зробити щось на кшталт відходу від дисципліни «операційної системи»), можна побачити «змістовні» фрагменти під назвою «екзони», відокремлені ділянками «маячні» під назвою «інтрони». Будь-який «ген» у функціональному сенсі фактично розбитий на послідовність фрагментів (екзонів), відокремлених беззмістовними інтронами. Немов кожен екзон закінчується вказівником: «Продовження на сторінці такій-то». Виходить, що ген складається з усієї низки екзонів, які фактично сходяться разом, лише коли врешті-решт зчитуються «формальною» операційною системою, що «перекладає їх мовою білків».
Читать дальше