Например, допустим, что несколько раз дельфин слышит свисток (а затем получает рыбу), когда выпрыгивает из воды. Затем он начинает выпрыгивать каждый раз, когда дрессировщик поднимает руку. Затем он открывает для себя, что прыжок «работает» только тогда, когда дрессировщик поднимает руку. Так поднятая рука становится зелёным светом для прыжка.
Дрессировщик может постепенно вводить и другие условия — прыжок «работает» только в направлении от дрессировщика и по направлению к публике, когда прыжок выше полутора метров, когда прыжок совершается ровно через три секунды после поднятия руки. И, наконец, после нескольких уроков дрессировщик обучает дельфина делать «поклон на публику», по команде и с большой точностью. Дельфин тоже учит дрессировщика: «Все, что я делаю, представляет собой определённые виды прыжков, когда дрессировщик поднимает руку, он немедленно мне свистит и даёт рыбу каждый раз!»
Заметьте, что свисток не используется как команда. Он не приказывает дельфину что‑то делать, сигналом к действию является поднятая рука. Свисток говорит дельфину в течение или в конце действия, что дрессировщику нравится это действие и за него дельфин получит рыбу. (Вы можете не зацикливаться только на пище, вы также можете связать условное подкрепление с лаской или игрушкой или другим стимулом.)
Теперь свисток становится условным подкреплением. На языке психологов пища, ласка или любое приятное переживание являются безусловным подкреплением, чем‑то, что животное хочет получить безо всякого обучения. Свисток же является условным подкреплением, это то, что животное учат хотеть сделать. (Некоторые люди используют термин «первичное подкрепление» для пищи и «вторичное подкрепление» для сигнала. Я избегаю этих терминов, поскольку они приводят к мысли, что раз свисток «вторичен», он должен даваться после пищи, что для животного, конечно, бессмысленно и бесполезно как инструмент дрессировки.)
Главная роль
Что случится, если вы постараетесь научить дельфина простым прыжкам от вас по указанию, но не используя свисток? Во‑первых, вы не сможете правильно выбрать время для вознаграждения рыбой, когда животное сделало плохой прыжок. Поэтому не имеет значения, какой прыжок сделало животное, ему всё равно потом дадут рыбу или не дадут рыбы вовсе. У вас нет возможности объяснить животному, почему один прыжок будет вознаграждён, а другой нет, или какой прыжок вам понравился больше. Был ли он достаточно высоким? Или вам понравилось, как животное уплывает или подплывает? Чтобы разработать прыжок нужной высоты, своевременности и направления, вы должны исключить все неточности методом проб и ошибок на многочисленных дрессировках. Вы будете счастливы, если животному не надоест (и дрессировщику тоже!), прежде чем исполнение будет правильным и точным.
Из‑за отсутствия информации об этом, тот дрессировщик, который использует пищу как вознаграждение безусловного подкрепления обычно получает животное, которое работает энергично, но учится медленно. Мы наблюдали это и на собаках, которых вознаграждали многократно лакомством без какого‑то ясного сигнала, который бы точно обозначил подкрепляемое действие. Эти собаки полны энтузиазма и дружелюбия, но они ничего не знают.

Дрессировка с лакомством эффективна всегда, но без условного подкрепления, например кликера, собака может стать одержимой попрошайкой.
К тому же если дрессировщик использует пищу без условного подкрепления, животное учится постоянно следить за дрессировщиком в ожидании пищи. Лошади суют нос вам в карман, а собаки лижут руки. Дельфины плавают вокруг дрессировщика и боготворят ведро с рыбой. Если животное постоянно следит за дрессировщиком, очень трудно научить дельфина прыгать в противоположном направлении, к публике.
Когда вы выработали условное подкрепление, вы сможете идентифицировать действие на расстоянии или когда животное двигается от вас. Поэтому хорошо обученное животное вместо того, чтобы надоедать вам своим попрошайничеством, будет делать своё дело, но одновременно внимательно слушать магический звук, чтобы оно ни делало: для лошадей и собак эта внимательность имеет огромное обучающее значение сама по себе.
Поскольку сигнал позволяет отмечать доли секунды, то свистком можно развить у животного точное понимание, чего хочет дрессировщик. Это позволит обучить животное, чему вы хотите, очень чётко и подробно. Например, пусть дельфин выучил одно правило (прыгать в заданном направлении), поэтому вы уверены, что он почти всегда прыгает в правильном направлении по вашему сигналу. Теперь добавим новые детали или правила. Вы решили: «Я буду подкреплять только высокие прыжки». Дельфин достаточно быстро учится новым деталям («Я должен прыгать в этом направлении и прыгать высоко»).
Читать дальше