И вот, в третьей, контрольной части опыта, когда был подан звуковой сигнал, он вызвал не только поворот на себя, но и отделение слюны! Правильным оказалось предположение, что в первой части опыта между центрами светового и звукового сигналов образовалась новая условная нервная связь. Она образовалась на одном сочетании двух чисто ориентировочных раздражителей, без всякого делового подкрепления. Значит, ориентировочное подкрепление является таким же действенным, как и всякое другое: одно подтверждение ожидаемого (по сигналу А) события (Б) может служить полноценным подкреплением для образования новой, нервной, условной связи между А и Б.
§ 3. Виды ориентировочного подкрепления
Благодаря исследованиям И. П. Павлова и его школы мы знаем, как тонко реагирует животное на малейшие изменения всех компонентов условного рефлекса. В частности это относится к изменениям подкрепления, его количественной и качественной стороны. В последнем случае дело идет о том, вполне ли совпадает предлагаемое подкрепление с тем, которое было показано животному до начала его действий; эти опыты были произведены сначала вне лабораторий И. П, Павлова. Расхождение между приманкой, которая вначале показывалась и пряталась, и тем, что потом обнаруживалось животным (и должно было служить подкреплением) всегда вызывало «нарушения» в поведении животного. Это и наблюдалось в известных опытах Тинклпо (О. L Tinklepaugh) [58] Tinklepaugh О. An Experimental Study of Representative Factors in Monkeys. J.Compar. Psychol., 1928. Vol. 8. S. 197–236; Idem. The Multiple Selayed Reaction with Chimpanzees and Monkeys. J. Compar. Psychol., 1932. Vol. 13. S. 2.
, подтвержденных у нас Н. Ю. Войтонисом [59] Войтонис Н. Ю. Сравнительно-психологическое изучение памяти методом отсроченных реакций. В сб.: Рефлексы, инстинкты и навыки. М., 1936.
. Когда животное обнаруживает под крышкой не тот предмет — приманку — который был ему показан в начале опыта, оно проявляет явные признаки встречи не с тем «потребным будущим», которое ожидалось. Такого рода опыты служат доказательством того, что существует не только полное, но и неполное ориентировочное подкрепление, чисто ориентировочное, потому что животное обнаруживает «замешательство» при одном восприятии подмененной приманки, еще до того, как начинает ее есть (а иногда отказывается есть и «с гневом» отбрасывает приманку).
Но существует еще один вид ориентировочного подкрепления, значение которого трудно переоценить. В отличие от подкрепления полного и неполного, но все-таки получаемого или неполучаемого, которое поэтому можно назвать альтернативным («да-нет»), этот новый вид подкрепления можно назвать «относительным ориентировочным подкреплением», так как оно возникает из учета того отношения, в котором фактический результат действия оказывается к намеченному, заданному. Так, например, животное промахивается и не достигают «цели»: сточки зрения «альтернативного подкрепления» это просто «нет», т. е.
отрицательное подкрепление; однако, если при этом животное замечает насколько и куда оно отклонилось от цели, то это служит относительным ориентировочным подкреплением и позволит ему внести надлежащую поправку в следующую «пробу».
В процессе формирования новых действий путем «проб и ошибок» успешное действие сначала возникает случайно, среди многих безуспешных проб. Постепенно число таких проб уменьшается, а потом и вовсе исчезнет. Если бы существовало только альтернативное подкрепление («да-нет») и каждая проба получала только квалификацию «правильно-неправильно», никакого прогресса в научении не могло бы наступить: неудачные пробы просто отбрасывались до появления такой же случайно удачной пробы. Допустим, что эта удачная проба сразу оставляет после себя четкую кинестетическую картину, по которой она может быть точно воспроизведена в следующий раз. Но тогда выступает другая сторона проблемы: только в исключительном случае положение животного относительно «цели» окажется точно таким же, каким оно было в прошлой, удачной пробе; между тем достаточно уже небольшого изменения этого относительного положения, чтобы точно воспроизведенное и в прошлый раз удачное действие теперь оказалось неудачным. Если к этому добавить неточное исполнение прежде удачного действия (что практически всегда имеет место), то вероятность его успешного выполнения становится еще меньше. Собственно это мы и наблюдаем, когда вслед за успешным выполнением задания следует большое число неудачных проб.
Читать дальше