Что же в итоге? Цвет глаз, кожи и, разумеется, пол предсказывали точно, “однако для комплексных признаков наша модель объясняла лишь малую часть наблюдаемых фенотипических вариаций”, как деликатно выразились авторы. Не получилось предсказать по геному цвет волос и вероятность облысения.
Фактически людям из Human Longevity удалось сделать следующее. Они выбирали из своей тысячи участников небольшие подгруппы – скажем, 10 человек, затем брали один из десяти геномов и пытались угадать, кому из десятки он принадлежит, сопоставляя результат реконструкции с реальными портретами. Угадывали для десятки с вероятностью около 74 %, причем результаты предсказуемо ухудшались, если подгруппа была этнически однородной – состояла, например, только из африканцев или только из европейцев. Результат гораздо лучше, чем при случайном выборе, но до “опознания по фото” отсюда еще далеко.
Со временем, считают авторы, точность предсказаний будет расти, когда мы узнаем больше о признаках, определяющих черты лица и в том числе о низкочастотных вариантах, связанных с редкими фенотипами. Возраст можно будет предсказать точнее по метилированию генома. Правда, есть еще одна проблема: для полногеномного секвенирования пока что требуется порядка 100 нг ДНК, а на месте преступления обычно находят гораздо меньше, если нет следов крови или спермы. Так что старый добрый PCR-анализ на STR еще не скоро сдаст позиции.
Несмотря на все эти оговорки, результаты и выводы Вентера и соавторов сразу же были подвергнуты критике. Самым активным и язвительным был уже упоминавшийся Янив Эрлих из университета Колумбии. Человек он резкий, ведет “Твиттер”, в котором, невзирая на лица и регалии, высказывается об ошибках и недомыслии ученых коллег. Собственно, у него самого с регалиями дело обстоит неплохо.
Эрлих знает толк в защите информации и ее слабых местах. В середине 2000-х гг. он работал в израильской фирме, которая занималась обеспечением безопасности финансовых учреждений. И позднее, когда он заинтересовался безопасностью геномов, журналисты с удовольствием вспоминали тот период его жизни. Даже Nature дополнил рассказ о нем видеороликом 2006 г., где совсем молодой Янив Эрлих в худи с надвинутым капюшоном заходит, как к себе домой, в отдел ИТ крупного банка, обманывая считыватель отпечатков пальцев с помощью тонового набора на мобильном телефоне. А напоследок еще оборачивается на камеру и весело разводит руками: полиция кончается там, где начинается Беня! [168] Hayden E. Ch. Privacy protections: The genome hacker // Nature. 2013; 497: 172–174; doi: 10.1038/7172a.
Повезло нам, что этот человек на стороне Света.
В области геномной безопасности Эрлих проделывает, по сути, то же самое: эффектно демонстрирует, где в этой безопасности дыры; об одной такой демонстрации с применением базы данных MyHeritage мы рассказывали. В сентябре 2017 г. эта работа еще не была опубликована, но Эрлих и тогда уже был признанным авторитетом в этой области. Именно он в свое время язвительно откомментировал заявление гейдельбергской European Molecular Biology Laboratory о том, что из опубликованного генома знаменитой клеточной линии HeLa якобы нельзя извлечь никакой информации о Генриетте Лакс (женщине, которой принадлежала опухолевая ткань, ставшая источником клеток) и ее потомках. “Мило врет EMBL!” – написал он в “Твиттере”. И в итоге EMBL пришлось признать правоту вредного биоинформатика.
Так вот, усилия команды Вентера его не впечатлили. По мнению Эрлиха, не стоит срамиться с портретами по ДНК, пока их точность драматически уступает другим методам деанонимирования генома – тому же поиску в генеалогических базах. Через STR Y-хромосомы становится все проще выйти на фамилию человека или, по крайней мере, на его родственников по мужской линии, так зачем тратить усилия на эффектный, но неработающий способ? Чем-то это напоминает старый анекдот про идентификацию человека по аудиозаписи голоса: “Покажите, как это работает!” – “Очень просто. Четко назовите в микрофон ваши имя, отчество и фамилию”.
Чтобы продемонстрировать наглядно, насколько скромны успехи Вентера и соавторов, Янив Эрлих опубликовал на сервере bioRxiv критический отзыв буквально через день после публикации Вентера. Этот момент сам по себе примечателен: темп научных дискуссий стал стремительным как никогда. Раньше после публикации в рецензируемом журнале критического ответа приходилось ждать месяцы, если не годы, не говоря о том, что критику менее охотно принимают к публикации, чем результаты с “положительным” содержанием. Спасибо bioRxiv и социальным сетям, теперь тот, кто опубликовался в журнале первого ряда, уже не чувствует себя “в домике”: критика мгновенно появляется в общем доступе, а если критикует известный человек, это способно здорово отравить успех.
Читать дальше