Кнут и пряник (в англоязычном варианте, морковка и палка) — это старинный метод поощрения и наказания, с помощью которого можно регулировать мотивацию людей к определенному поведению. Кнут и пряник, или оперантное обусловливание, научно описывается в Теории подкрепления Б. Ф. Скиннера 1971 года. Теория подкрепления является основополагающей в бихевиоризме и широко применяется в психологии, педагогике, политике, менеджменте, спорте и дрессировке животных.
Теория подкрепления (оперантное обусловливание)
Читайте о практическом применении теории подкрепления в наших статьях: Положительное подкрепление и личные границы, Как реагировать на пассивную агрессию и Теория социального обмена.
Оперантное обусловливание — это влияние последствий поступков человека (оперантов) на его поведение в будущем. Б. Ф. Скиннер указывает на соответствие теории оперантного обусловливания теории естественного отбора Дарвина. Ведь это не что иное, как отбор на основе последствий поведения. Благодаря положительному подкреплению (поощрению) поведение закрепляется в будущем как полезное и получает стимул к повторению. После получения негативного подкрепления (наказания) поведение угасает, как вредное или ненужное. Поощрение является пряником (морковкой), а наказание — кнутом (палкой). В природе особи, не усваивающие ‘уроки’ оперантного обусловливания, естественно выбраковываются в процессе эволюции.
В отличие от классического (ответного) обусловливания Павлова, оперантное обусловливание является добровольным. Сравните:
Ответное обусловливание Павлова. В ответ на стимулы (свет, звонок), после которых поступала еда в прошлом, у собаки выделяется слюна. Это условный рефлекс, слюна выделяется непроизвольно.
Оперантное обусловливание Скиннера. Поведение в прошлом (хорошо сделанный доклад) вызвал поощрение (оперант) в виде денежной премии. Теперь человек старается хорошо делать новые доклады ради новой премии (стимула). Т.о. человек добровольно выбирает выгодное, полезное для себя поведение.
Кнут и пряник: поощрение и наказание
Поощрение (пряник)
Подкрепление — это последствия действий, которые служат стимулом к увеличению вероятности или частоты этих действий в дальнейшем. Скиннер разделяет подкрепление на положительное и отрицательное, см. схему выше. Положительное подкрепление (поощрение) — это добавленные (появившиеся) приятные последствия поведения. Пример положительного подкрепления: вы сделали отличный проект и получили за него крупный гонорар. Отрицательное подкрепление — это устранение (исключение) неприятной ситуации через поведение. Отрицательное подкрепление делится на устранение (уже знакомой неприятной ситуации в настоящем) и уклонение (профилактическое действие для избежания проблемы в будущем). Пример устранения — прием таблетки, когда болит голова. Пример уклонения — здоровое питание и активный образ жизни для профилактики проблем со здоровьем в будущем.
Наказание (кнут)
Положительное наказание — это появление неприятных последствий поведения. Пример положительного наказания: вы дотронулись до горячей кастрюли и обожгли палец. Отрицательное наказание — это исчезновение чего-то приятного в качестве реакции на поведение. Пример отрицательного наказания: ребенок не слушался и родители лишили его развлечений.
Трехчастная контингенция
Схема трехчастной контингенции в теории оперантного обусловливания (см. схему слева) описывает взаимосвязи между первичным стимулом (А), ответным поведением человека (В) и последствиями этого поведения (оперантом) (С). В зависимости от полученного подкрепления будет формироваться будущее поведение. При положительном подкреплении возникает повторяемость поведения в будущем, при отрицательном — угасание поведения.
Угасание поведения
С помощью подкрепления и наказания у индивида закрепляется понимание, какое поведение является для него хорошим (полезным), а какое — плохим (вредным).
Однако после регулярного получения вознаграждения оно становится не таким ценным и желанным. Происходит насыщение.
Если (положительное и отрицательное) подкрепление перестает поступать, то со временем закрепленное поведение угасает (исчезает). Перед окончательным угасанием поведения может происходить его временное ‘взрывное’ усиление . Объяснение этого интересного феномена также лежит в теории естественного отбора и эволюции. Более настойчивые особи, дольше не сдающиеся трудностям, имели лучший шанс на выживание и воспроизводство.