Положительным наказанием для Уоллаби было бы, если бы Питер сделал ему физическое внушение, скажем, коленом в грудь, когда тот попытался бы прыгнуть. В отношении ребенка положительным наказанием является окрик или шлепок. Если бы родители только шлепали ребенка, когда он не слушался, то единственной наградой для него было бы не получить шлепка – это называется отрицательным подкреплением.
Данное представление об отрицательном и положительном не имеет ничего общего с сопоставлением плохого и хорошего. Отрицательное означает забирать; положительное – давать. Таким образом, положительное подкрепление означает дать подкрепление или поощрение. Отрицательное подкрепление означает не дать этого поощрения.
Дрессировка собак с помощью методики положительного подкрепления ориентирована на получение поощрения. Вот почему мы используем одновременно и положительное подкрепление (когда поощряем) и отрицательное наказание (когда лишаем поощрения). Традиционные методы дрессировки ориентированы на наказание. Те, кто им следуют, стремятся выделить положительное наказание (производя физическую коррекцию в форме резкого окрика или рывка поводка со строгим ошейником) и отрицательное подкрепление (лишение наказания, например, не дергать поводок со строгим ошейником).
Это различие между отрицательным и положительным может вызвать некоторое недопонимание, поэтому вернемся к Питеру и Уоллаби. Питер использовал модель положительного подкрепления, чтобы изменить поведение Уоллаби, убедительно говоря ему: «Мне нравится, что ты прыгаешь; сделай это еще несколько раз». Поощрение подкрепляло положительное поведение Уоллаби. Питер наказывал Уоллаби с помощью метода отрицательного наказания: никакой похвалы или лакомства, если Уоллаби прыгал, когда Питер не просил его об этом, что означало: «Ты можешь прыгать весь день, но я тебя игнорирую. Делать так не имеет никакого смысла».
Давайте представим, что Питер продолжил использовать традиционную аверсивную модель дрессировки. Если бы Уоллаби прыгнул на Питера, тогда он вынужден был применить положительное наказание, физический или вербальный выговор. Этим положительным наказанием он должен был сказать Уоллаби: «Не прыгай». Когда Уоллаби не прыгал, Питер не делал ничего, что является отрицательным поощрением: Уоллаби не получал наказания. Иными словами, Питер пытался сказать Уоллаби: «Когда ты не прыгаешь, это не значит плохо». Отрицательным поощрением является попытка подкрепить положительное поведение Уоллаби (не прыгать).
Лично я, как профессионал, нахожу в этой логике изъян. Уоллаби в действительности никогда не говорили, чтобы он делал конкретную правильную вещь – фактически Питер хотел, чтобы он не прыгал. Уоллаби вынужден был догадываться, что делать, методом исключения, но ему при этом не говорили, что он понял все правильно. Даже крыса, рыскающая в лабиринте, в итоге получает вознаграждение, когда находит сыр. Собака, которую дрессировали, используя только модель аверсивного наказания, вынуждена разбираться во всем сама. А это требует абстрактного мышления, к чему мозг собаки совсем не приспособлен.
Более того, когда животное получает «кнут» слишком часто, оно либо оказывает сопротивление, либо сдается и падает духом. Дрессировщики, работающие по традиционной модели, обычно ждут момента, когда собака отступит. Они уверены в том, что такое ослабленное состояние животного – удобный момент, когда можно построить желаемую модель поведения. И хотя подобный подход может быть эффективным в экстремальных случаях, когда собака проявляет агрессию, при условии, что есть поддержка такого опытного и знающего дрессировщика, как Сизар Миллан, тем не менее, это опасное оружие в руках среднестатистического владельца собаки, и еще более опасное – в руках ребенка.