— Это объясняет, почему их Ретикулум меньше, чем наша Паутина: нет табу на наготу и секс — нет порнографии. Наша сеть полегчала бы на целые зеттабайты, если бы в ней не было всего этого дела.
— Именно. Но это ещё не всё. У инопланетян три руки. У самцов две слева и одна справа, у самок наоборот. Это довольно странный диморфизм, но можно понять, каким образом он закрепился в ходе эволюции. Они прислали нам множество изображений семейных групп; самец и самка по бокам, ребёнок посередине. Они не держатся за клешни, однако самка кладёт левую клешню ребёнку на одно плечо, а самец — правую клешню на другое, и таким образом ребёнок оказывается под защитой, в то время как у каждого из взрослых остаётся две свободные руки с внешней стороны, верно?
— Ну… да, — сказала Ханна.
— Алгоритмы разглядели в этом более глубокий смысл. Сознательно или нет, инопланетяне явно помещают ценные для них вещи с той стороны, где у них одна рука. Мы назвали их «моносторона» и «бисторона», и всё, имеющее большую ценность и нуждающееся в защите, всегда находится на моностороне.
— И всё это сделали алгоритмы? Начав с нуля?
— Не с нуля. Они начали с сотен миллионов изображений, каждое из которых просмотрели с терпением и вдумчивостью, недоступной человеку.
* * *
Наконец, пришла очередь Эмили занять место свидетеля. Ханна Плакстон задала ей серию отрепетированных вопросов об алгоритмах извлечения данных, открывших для человечества Ретикулум. Но потом Пётр Судейко начал перекрёстный опрос.
— Доктор Чу, — сказал он, — я был впечатлён естественностью речи Урсулы.
— Спасибо.
— Вы в самом деле проделали великолепную работу, создав ИИ-аватар инопланетянина, с помощью которого можно осуществлять поиск в Ретикулуме так же легко, как в нашей Всемирной паутине.
— Спасибо. Это была командная работа.
— Это правда поражает воображение. Я считал, что универсальная трансляция того сорта, что выполняет Урсула, невозможна. Не могли бы вы пояснить нашему достойному жюри присяжных, каким образом это было достигнуто?
— Конечно. Мы достигли первого прорыва в деле распознавания спонтанной речи в 2010 году, воспользовавшись полностью связными глубинными нейронными сетями, или ГНС. Для глубинного обучения вы даёте нейронным сетям всё новые и новые образцы, и сравнивая их, сети в конце концов догадываются о семантике слов, семантике предложений и модели знаний.
Одним из ключевых факторов оказалось понимание того, что семантическое намерение лучше определяется на уровне фразы/предложения, а не уровне отдельного слова. В конце концов, слова часто многозначны: «лук» — это овощ или метательное оружие? Но фраза или предложение, а ещё лучше документ целиком, содержат богатую контекстную информацию, которой мы можем воспользоваться. И, разумеется, целая сеть, неважно, их или наша, содержит бесчисленные розеттские камни. К примеру, есть лишь несколько способов представления периодической системы элементов, а любая технологически развитая цивилизация должна как-то это делать.
Так что наши нейронные сети просто смотрят, какие инопланетные слова часто соседствуют с изображениями каких объектов. Это статистическая игра, но если играешь в неё достаточно долго, то выигрываешь.
— Понятно. И для простых вещей оказывается довольно легко составить таблицу перевода.
— Верно. К примеру, они прислали тысячи фотографий образцов минералов, и, просматривая тексты, связанные с этими фотографиями, нейронные сети способны не только выяснить названия конкретных минералов — как на их языке называется кварц или алмаз — но и со временем догадаться об их более общих терминах, в том числе таких, что подчёркивают различия, о которых даже большинство людей не имеет понятия, как к примеру, о разнице между «горной породой» и «минералом».
— Должна признаться, что я и сам не знаю, в чём разница.
— Минерал однороден и имеет специфическую кристаллическую структуру; горная порода сложена из множества минералов.
— Вот как, — сказал Судейко. — Значит, я полагаю, пользуясь той же самой методикой, ваши алгоритмы опознали слова, которыми инопланетяне называют, скажем, «ручей» и «реку»?
— Точно так.
— «Пруд» и «озеро».
— Верно.
— «Море» и «океан».
— Э-э…
— Да, доктор Чу?
— Разумеется, наша методика способна сопоставлять лишь то, для чего существуют термины в обоих языках. Я уверена, что вы видели фотографии их планеты и их карты мира. Их планета гораздо суше нашей. Там нет морей и океанов — и поэтому отсутствуют континенты и крупные острова. Карта их мира выглядит как ломтик швейцарского сыра, в котором дырки — это озёра.
Читать дальше