М. Ф.: В 2015 г. вы основали собственную компанию Elemental Cognition. Расскажите о ней.
Д. Ф.: Это исследовательская компания, занимающаяся ИИ, которая пытается добиться реального понимания языка. Это область ИИ, в которой пока ничего особого не сделано. Мы хотим выйти за пределы поверхностной структуры языка и шаблонов, которые встречаются в частоте повтора слов, и понять скрытый смысл. Это позволит строить внутренние логические модели, которыми люди пользуются для рассуждений и общения. Мы хотим создать систему, автономно изучающую окружающий мир, в том числе через диалог с человеком.
Попытки определить, что же такое знание и понимание, – интересная часть нашей работы, ведь люди могут давать разные интерпретации одного и того же текста.
М. Ф.: Да, распознав на изображении кошку, существующие системы не воспринимают ее так же, как люди.
Д. Ф.: Вопрос «что такое кошка?» так же труден, как «что такое понимание?». Вспомните, сколько энергии уходит на то, чтобы достичь взаимопонимания между людьми. Поэтому в науках разработаны формальные языки, которые недвусмысленно передают информацию. Для обычного общения мы используем естественный язык, в котором важны контексты и намерения. Чтобы достичь уверенного понимания, люди задают друг другу вопросы, возвращаются к ранее сказанному, согласовывают свои представления, пока у обеих сторон не появятся похожие модели предмета разговора. И все потому, что сам язык не несет информации, а является только средством синхронизации самостоятельных моделей.
Например, когда моей дочери было семь лет, она прочитала в книге, что электричество – это энергия, которая создается разными способами, в частности с помощью воды, вращающей турбины. После текста задавался простой вопрос: «Как производится электричество?». Дочь еще раз заглянула в текст, сопоставила его с вопросом и сказала, что слово «создано» – синоним слова «произведено», а значит, ответом будет фраза: «Вода вращает турбины». Примерно так работает большинство современных языковых ИИ-приложений. Разница в том, что моя дочь осознавала, что сути она не понимает, а только копирует информацию. Ей было интересно, как все выглядит на самом деле, потому что от своего логического представления она ожидала гораздо большего. Я воспринял это как признак интеллекта.
М. Ф.: Вы говорите сейчас об ИИ человеческого уровня?
Д. Ф.: Когда мы научимся создавать системы, умеющие обучаться автономно, то есть понимать прочитанное и строить на его основе модели, а затем синхронизировать их в процессе общения, можно будет говорить, что мы приблизились к тому, что я назвал бы целостным интеллектом.
Я делю полный ИИ на три части: восприятие, контроль и знание. Многие из процессов, происходящих в сфере глубокого обучения, позволили значительно продвинуться в первых двух элементах. Третьим элементом мы пытаемся заниматься в компании Elemental Cognition.
М. Ф.: Решить проблему понимания – одна из заветных целей всех, кто занимается ИИ. После этого многое станет возможным. Например, перенос обучения – применение знаний из одной области в другой.
Д. Ф.: Совершенно верно. Среди прочего мы занимаемся тестированием того, как система понимает и объединяет сведения, которые она в процессе чтения извлекла даже из самой простой истории. Может ли она, прочитав рассказ о футболе, разобраться, что происходит во время игры в баскетбол? Как она использует концепции, с которыми познакомилась? Может ли проводить аналогии?
Сложность в том, что люди рассуждают разными способами. Они делают то, что можно сравнить со статистическим машинным обучением. То есть обрабатывают множество данных, формируют обобщенный шаблон и применяют его. Они формируют в голове своего рода линию тренда и с ее помощью интуитивно ищут новые ответы. Могут взглянуть на набор значений и сказать, какое значение может быть следующим. По сути, происходит сопоставление с образцом и экстраполяция. Причем обобщение может оказаться более сложным, чем в случае с линией тренда. Это сравнимо с методами глубокого обучения.
Но когда человек говорит: «Я считаю, что следующим в этом наборе чисел должно быть число 5, потому что…», у него появляется логическая или причинная модель. Это уже совсем другой, гораздо более полезный вид информации, потому что появляется возможность аргументированно возразить: «Вот здесь твои рассуждения ошибочны, потому что…». Подобное невозможно в ответ на заявление: «Это просто моя интуиция, основанная на данных. Доверься мне».
Читать дальше
Конец ознакомительного отрывка
Купить книгу