Это означает, что даже такие ультрасовременные алгоритмы легко сбить с толку. Поскольку они составляют статистическое описание распределения света и тени на лице, достаточно надеть очки с оригинальной оправой и декором на стеклах, и алгоритм запутается. Более того, если разрисовать очки так, чтобы декор дал сигналы, схожие с чужим лицом, можно заставить алгоритм выдать решение, что вы и есть тот самый человек — парень на фото ниже воспользовался этим приемом, нацепив очки, в которых он выглядит в точности как Мила Йовович [351]. Очки для маскировки? Похоже, Кларк Кент что-то знал.
Оставим выходки с экстравагантными очками — возможности статистических алгоритмов в распознавании лиц были отмечены во множестве восторженных публикаций, и, в частности, на все лады расхваливали гугловский FaceNet . Чтобы проверить зоркость этого алгоритма, ему велели опознать 5000 лиц известных людей. Предварительно то же задание выполнили на отлично живые эксперты, которые угадали в 97,5 % случаев — что неудивительно, потому что известные всему миру лица участникам эксперимента тоже были известны [352]. Но FaceNet выступил еще лучше, добившись феноменальной точности 99,6 %.
Вроде бы выходит так, что в распознавании лиц машины превзошли человека. Казалось бы, при столь блестящих результатах мы с полным правом можем применять алгоритмы для опознания преступников. Однако тут кроется один подвох. На самом деле для тестирования алгоритма пять тысяч лиц — это очень мало. Когда его задействуют в борьбе с преступностью, ему придется выловить одно-единственное лицо не из нескольких тысяч, а из нескольких миллионов.
Ибо в базе данных британской полиции насчитывается девятнадцать миллионов лиц — изображений, созданных по фотографиям тех, кого арестовали по подозрению в совершении преступления. А вот ФБР располагает коллекцией в 411 миллионов изображений, и, по некоторым источникам, в нее входят лица половины взрослого населения Америки [353]. В Китае же, где база данных об удостоверяющих личность документах позволяет без труда получить сведения о миллиардах лиц, программы распознавания лиц уже получили мощную поддержку государства. На улицах, в метро и аэропортах — повсюду установлены камеры видеонаблюдения, от объективов которых не уйдет ни объявленный в розыск преступник, ни беспечный пешеход, гуляющий по городским улицам [354]. (Говорят даже, что всякие незначительные провинности вроде брошенного на улице мусора учитываются в рейтинге граждан, в системе Sesame Credit , — со всеми вытекающими последствиями для нарушителей порядка, о которых рассказывалось в главе “Персональные данные”.)
Возникает проблема: с ростом числа лиц в базе данных многократно увеличивается вероятность ошибочной идентификации. Чем больше лиц просматривает алгоритм, тем больше у него шансов отыскать два похожих. Поэтому, когда те же алгоритмы работают с более обширной подборкой изображений, их точность резко падает.
Допустим, мне дали десять удостоверений личности незнакомых людей и предложили сказать, которое из них чье; допустим, я прошла тест на отлично — стало быть, сумею узнать любого человека по изображению его лица, поэтому меня отправили в центр Нью-Йорка высматривать в толпе преступников, на которых имеется ориентировка. Очевидно, я не смогу продемонстрировать тот же высокий уровень точности.
То же самое происходит с алгоритмами. В 2015 году Вашингтонский университет провел конкурс MegaFace — специалистам со всего мира предложили протестировать свои алгоритмы распознавания лиц на базе данных объемом в миллион изображений [355]. Хоть и ближе к реальности, но существенно меньше, чем содержится в каталогах госорганов. И все равно алгоритмы выдержали экзамен не слишком успешно.
FaceNet компании Google , почти безупречно выполнивший задание со знаменитостями, показал неожиданно невысокий результат — идентифицировал верно всего лишь 75 % [356]изображений. Другие алгоритмы дали всего лишь 10 % верных ответов. На то время, когда писалась эта книга, чемпионом был китайский продукт Tencent YouTu Lab , точность которого в распознавании лиц составила 83,29 % [357] [358].
Иными словами, если бы вы искали конкретных преступников в веренице миллионов цифровых изображений, то, судя по приведенным результатам, вы упустили бы каждого шестого — и это при самом благоприятном исходе.
Однако следует помнить, что эта область знаний стремительно развивается. Точность ответов неуклонно повышается, и как будут обстоять дела через годы или через несколько месяцев, никто не знает. Могу сказать лишь, что различные позы и внешний вид объектов, освещенность и качество изображения — все эти детали страшно усложняют создание надежного и точного инструмента для распознавания лиц. До идеальной точности поиска нужного лица среди четырехсот миллионов нам еще довольно далеко, и мы пока не можем найти того самого единственного на триллион, полностью идентичного двойника.
Читать дальше
Конец ознакомительного отрывка
Купить книгу