Другой пример — создание каталога всех имеющихся в геноме человека ферментов, называемых протеинкиназами («кином»). В результате этого поиска было выявлено 518 генов, кодирующих протеинкиназы, и, кроме того, 106 псевдогенов. При этом 70 из обнаруженных генов ранее были совсем неизвестны. Выяснилось также, что почти половина генов «кинома» располагается в участках генома, связанных с различными заболеваниями человека.
Дешифровка последовательности белка с помощью компьютера напоминает работу криптографов — из последовательности отдельных букв читается весь биологический текст, и на основании этого выясняется, что это за белок, какова его функция в организме. Впечатляющие результаты были получены, например, австрийцем Айзенбергом. Используя дешифровальные методы анализа нескольких тысяч белков, не проведя при этом ни одного эксперимента, он сразу предсказал функции почти половины из них. Вспомним, что еще не так давно ученые иногда тратили всю жизнь, чтобы определить структуру одного белка и познать его функцию. С помощью новых подходов можно одновременно предсказать функцию большого числа белков.
Для написания книги «Функционирующий геном» потребуется объединить вместе огромную информацию о картине работы десятков тысяч генов в различных типах клеток на разных стадиях развития и в разных физиологических состояниях, данные о структуре и функции отдельных белков, кинетические параметры, концентрации молекул, сведения о взаимодействии генов и генных продуктов, реакции генома на экстремальные стимулы и различного рода патологические процессы. Связь между генотипом и фенотипом, то есть между генами и их проявлением в совокупности признаков и свойств организма, зачастую обусловлена сложным взаимодействием множества различных генов, а также факторов окружающей среды. По этой причине во многих случаях ее экспериментально пока не удается однозначно установить. Слишком сложна задача и слишком много исходных данных. Такую ситуацию часто называют проблемой нелинейного картирования. Чтобы решить эту проблему, био- и гено-информатике понадобятся новые значительно более совершенные программы, еще более мощные компьютеры. В частности, для этой цели в настоящее время предложено использовать так называемое генетическое программирование. Гены в генетическом программировании рассматривают как аналоги компьютерных программ. Из огромного объема имеющейся информации, связанной с тем или иным фенотипом, строят многочисленные метаболические «деревья», соответствующие разным известным молекулярным взаимодействиям внутри клетки. Затем для поиска наилучшей модели, описывающей определенный фенотип, с «деревьями» осуществляют на компьютере различные операции, подобные мутациям и рекомбинациям в геноме. Следующий этап — отбор тех из них, которые в наибольшей мере соответствуют реальным данным. В конечном итоге все это позволяет осуществлять прогностическое нелинейное картирование, то есть указать на взаимосвязь между работой определенного набора генов и конкретного фенотипа. А далее уже наступает очередь экспериментаторов, которые должны подтвердить или опровергнуть данные, полученные с помощью генетического программирования. Таким образом, генетическое программирование служит для исследователей некой путеводной звездой. Несмотря на сложность задачи, ожидается, что она будет решена не более чем через несколько десятков лет.
Однако нельзя переоценивать возможности современной биоинформатики, она еще далеко не все может решить. Тем не менее, она выступает в качестве мощного инструмента для первоначальной переработки огромной по объему информации, содержащейся в ДНК. Биоинформатика дает для исследователей ценные данные и делает их поиск целенаправленным. Такой поиск может быть продолжен в дальнейшем с использованием других подходов, в частности, экспериментов на культурах клеток или даже на целых животных. Например, как уже говорилось выше, функции тех или других генов человека можно эффективно изучать на модели трансгенных животных.
Кроме перечисленных выше, биоинформатика решает и множество других не менее важных и сложных задач. Таковым являются разработка методов анализа экспериментальной информации; компьютерное моделирование структурно-функциональной организации (вторичной, третичной структуры) генетических макромолекул (ДНК, РНК и белков), молекулярно-генетических процессов (репликации, транскрипции, сплайсинга, трансляции) и молекулярных взаимодействий между генетическими макромолекулами в генных сетях; исследование закономерностей молекулярной эволюции генетических макромолекул, а также молекулярно-генетических систем. Так, используемый в науке геногеографии картографический подход (о нем мы еще поговорим ниже), позволяющий исследовать пространственное распространение по нашей плавнете различных генетических признаков человека, долгие годы был чрезвычайно трудоемким и отнимал у ученых очень много времени. Использование компьютерных технологий принципиально изменило ситуацию, позволило существенно облегчить эти рутинные процедуры, давая исследователю возможность сосредоточиться непосредственно на вопросах творческого анализа географической изменчивости популяционно-генетических характеристик.
Читать дальше
Конец ознакомительного отрывка
Купить книгу