Удивительно, что операторы нейросетей обычно не понимают, как и почему алгоритм делает тот или иной вывод. Отбирая изображения собак, нейросеть не ищет те характерные особенности, которые мы с вами считаем собачьими. Степень сходства с определенной породой, будь то чихуахуа или дог, машину не интересует, она ориентируется на гораздо более абстрактные параметры, такие как контуры фигуры и светотень, которые человеку мало что говорят (взгляните на пример распознавания изображения из главы “Власть”, и вы поймете, что я имею в виду). Поскольку человеку трудно осмыслить этот процесс, операторы знают лишь, что они скорректировали свои алгоритмы так, чтобы те выдавали верные ответы, а подробности работы алгоритмов не всегда известны.
Это еще один метод машинного обучения, подобный алгоритму “случайного леса”, уже знакомому нам по главе “Правосудие”. Этот алгоритм выходит за рамки инструкций программистов, он умеет учиться самостоятельно по тем изображениям, которые ему предоставили. Именно способность алгоритма к самообучению дает нам основания говорить об искусственном интеллекте. Кроме того, множество уровней “рычажков и ручек” также делают структуру нейросети более глубокой и сложной, отсюда и взялся термин “глубокое обучение”.
Нейросети появились в середине XX века, но еще в недалеком прошлом нам не хватало мощных компьютеров, которые позволяли бы использовать весь потенциал нейросетей. Лишь в 2012 году, когда ученый-информатик Джеффри Хинтон и двое его студентов представили на конкурс по распознаванию изображений нейросеть нового типа [160], мир наконец встрепенулся и всерьез занялся искусственным интеллектом. Было дано задание: найти на картинках среди всего прочего собак. Программа Хинтона и его учеников посрамила самых сильных своих конкурентов и стимулировала широкомасштабное возрождение алгоритмов глубокого обучения.
От алгоритма, который сам принимает какие-то решения, как и почему — нам неведомо, попахивает нечистой силой, однако принцип его действия, возможно, не так уж далек от нашего с вами учебного процесса. Вот вам пример для сравнения. Недавно группа специалистов учила алгоритм различать на фотографиях волков и хаски. Как выяснилось, алгоритм подгонял свои настройки таким образом, что какие-либо признаки собак в качестве подсказки ему не требовались. Он принимал решения на основании того, был ли объект изображен на фоне снега или нет. Есть снег — волк. Нет снега — хаски [161].
Вскоре после того, как статья была опубликована, мне довелось побеседовать с профессором математики из Кембриджа Фрэнком Келли, и он пересказал мне свой разговор с четырехлетним внуком. По дороге в детский сад они увидали хаски. Мальчик сказал, что “собачка похожа на волка”. Фрэнк спросил его, откуда он знает — может, это и правда волк, и получил такой ответ: “Так она же на поводке”.
Союз интеллектов
К хорошей программе для скрининга молочных желез у нас два требования. Она должна быть достаточно чувствительной , чтобы всегда отлавливать отклонения от нормы в пораженных раком молочных железах, не пропуская ни пикселя и не выдавая их за “чистые”. Но она должна также действовать достаточно избирательно , чтобы под подозрение не попала абсолютно здоровая грудь.
В главе “Правосудие” мы уже говорили о правилах чувствительности и специфичности. Это тесно связано с понятиями ложноотрицательного и ложноположительного результата (на мой взгляд, в научной литературе термины “Дарт Вейдер” и “Люк Скайуокер” для этих категорий были бы вполне уместны). В данном случае мы имеем ложноположительный результат, если здоровой женщине говорят, что у нее рак, и ложноотрицательный — если женщине сообщают, что все хорошо, хотя на самом деле она больна. Специфичный тест крайне редко дает ложноположительные результаты, в то время как высокочувствительный — мало ложноотрицательных. В какой области будет использоваться алгоритм — для прогноза повторных правонарушений, диагностики рака груди или, что мы еще увидим в главе “Преступность”, для выявления повторяющейся картины преступной деятельности — значения не имеет, идея одна и та же. Вы хотите получить как можно меньше и ложноположительных, и ложноотрицательных результатов.
Возникает проблема: зачастую, чтобы довести алгоритм до ума, приходится выбирать между чувствительностью и избирательностью. Повышая одно, вы, как правило, понижаете другое. Скажем, если вы отдадите приоритет полному исключению ошибочных отрицательных ответов, программа может пометить каждую молочную железу, которую увидела, как подозрительную. Чувствительность достигнет ста процентов, и цель будет достигнута. Но вместе с тем это означает, что огромное количество пациенток начнет лечиться, не имея в том нужды. Или, допустим, главное для вас, чтобы программа не давала ложноположительных результатов. Она будет пропускать мимо все снимки как чистые, то есть избирательность приблизится к ста процентам. Чудесная картина! Если только вы не принадлежите к числу тех женщин, у которых алгоритм не заметил раковой опухоли.
Читать дальше
Конец ознакомительного отрывка
Купить книгу