Лекции по этологии
“Закон эффекта” Торндайка гласит: “Для реакции, за которой следует вознаграждение или состояние удовлетворения, вероятность повторения возрастает, а для реакции, вызывающей вредное или неприятное последствие, вероятность повторения снижается”.
Большинство современных психологов соглашаюся с тем, что для объяснения поведения взрослого человека “закон эффекта” имеет ограниченную сферу применения.
Проблемная клетка Торндайка открывается рычагом, помещенным внутри. Возле клетки ставят миску с кормом для животного. Когда в проблемную клетку помещают голодное животное, оно, пытаясь добраться до пищи, беспорядочно двигается внутри клетки, и , в конечном итоге, случайно нажимая на рычаг, оказывается на свободе. Вторая и третья попытки могут быть тоже случайными, но постепенно животное сосредотачивает свои движения возле рычага. Через несколько проб животное сразу, как только попадает в проблемную клетку, нажимает на рычаг , оказывается на свободе и получает подкрепление. Постепенно животное учится исключать из своего поведения все, что не ведет к подкреплению. Но вначале опыта в его поведении нет определенной системы - первое подкрепление животное получает случайно.
б) Свободно-оперентная методика по-Скиннеру. Это вариация методики, примененной Торндайком. Отличие от методики “проб и ошибок” в том, что животное подвергается не отдельным пробам, а может совершать любую реакцию в любое время. Обычно в инструментальной установке находится приспособление, например, рычаг, на которое животное должно воздействовать. В опытах, проведенных Скиннером в 1938 году, лабораторная крыса нажимает на рычаг и получает пищу. В начале опыта животное не совершает требуемую реакцию, но за поведение, приближающееся к реакции, которую хотят сформировать ,подкрепление получет. Вначале подкрепляется нахождение крысы в той части клетки, где расположен рычаг. Затем подкрепляют поднимание лапы по направлению к рычагу. Постепенно требования к реакции, заслуживающей подкрепления, повышаются. В конечном итоге подкрепляют уже само нажатие на рычаг.
Подкрепление не обязательно должно следовать за каждой реакцией. Иногда оно может быть перемежающимся: например, можно подкреплять только каждый энный ответ или только первую реакцию после данного интервала времени. Если подкрепление совсем прекратить, происходит снижение вероятности и темпа реакции , то есть происходит угашение.
Природа реакций и подкрепления должны быть выбраны с учетом особенностей изучаемого вида . Например. самцов сиамских бойцовых рыбок обучают совершать оперантную реакцию, в качестве подкрепления демонстрируя модель другой рыбы в агрессивной позе.
Существуют доказательства того, что у голубей, находящихся в камере Скиннера, вырабатывается, кроме оперантного, еще и классический рефлекс на ключ, который они должны клевать, чтобы получить подкрепление. Ключ голуби расценивают как пищу или воду. При пищевом подкреплении они клюют его таким движением, как если бы они клевали зерно, а при подкреплении водой, они нажимают на ключ полуоткрытым клювом и делают сосущие движения, как при питье.
Интересные исследования по выработке оперантных реакций у дельфинов были проведены американской исследовательницей Прайер. В каждой серии проб подкреплялись различные реакции. После того, как какая-либо реакция подкреплялась, в последующих сериях эта реакция уже не позволяла животному получить подкрепление. Когда был исчерпан весь репертуар реакций, на которые способны дельфины, животные стали вырабатывать множество новых, “творческих” реакций.
Опыты на выработку оперантных рефлексов были неоднокатно проведены с людьми. Карл Роджерс в книге “Взгляд на психотерапию.Становление человека” приводит результаты таких экспериментов. Например, с помощью оперантного обусловливания можно добиться у испытуемого значительного увеличения количества существительных во множественом числе в речи. Экспериментатор кивал головой всякий раз, когда испытуемый произносил нужную грамматическую форму. Испытуемый о эксперименте предупрежден не был и причины изменений в своем поведении не осознавал. Оперантным способом добивались увеличения в речи числа предложений, выражающих личное мнение испытуемого и ряда других поведенческих реакций.
Роджерс, как гуманист, хорошо пониматет опасность возможности манипулирования поведением человека и пишет, что психология - “орудие, в сравнении с социальной силой которого атомная энергия кажется слабой”. При этом он полагает, что достижения психологии могут использоваться или как средство управления человеком. или как средства освобождения человека. Можно получить либо общество свободных людей. либо общество пешек, управляемых с помощью науки о поведении. Но цель, ради которой используются достижения психологии, по мнению Роджерса, находится вне науки психологии.
в) Методики с отрицательным подкреплением. Животное должно вести себя так, как установлено экспериментатором, чтобы избежать болевых стимулов. В наиболее распространенном варианте этой методики используется челночная камера. Она состоит из двух отделений, окрашенных в разные цвета. Отделения сообщаются между собой проемом. Процедура начинается с ряда проб, сопровождающихся сигналом, например, зуммером.Животному дается несколько секунд, чтобы покинуть стартовую камеру и перейти в другую часть установки. Если животное этого не сделает, оно получит удар электротоком через электроды на полу камеры. По мере повторения ряда проб процент успешных избеганий растет. Было показано. что даже среди близкородственных видов животных успешнее обучаются те животные, которые в природе ведут более активный образ жизни.
г) Выработка дифференцировки. В этих опытах животному предлагают два или несколько стимулов и предоставляют возможность как-нибудь реагировать. Реакции на один из стимулов подкрепляются, на другие - нет. Научение состоит в повышении процента реакций на “правильный” стимул. Например, обезьяна будет всегда получать банан, если будет из двух предъявляемых стимулов выбирать стимул красного цвета. Существует очень много вариантов выработки дифференцировки. Некоторые задачи способны решить только животные с достаточно развитым интеллектом.
Одновременная дифференцировка. Все стимулы предъявляются в одно и тоже время. Задача животного - выбрать правильный стимул.
Последовательная дифференцировка. Стимулы предъявляются по одному. Животное должно тормозить реакцию в присутствии неправильного стимула.
Переделка дифференцировки. Значение положительного стимула меняется от одной задачи к другой. Например, животное должно выбирать между красным и зеленым стимулом, причем красный - положительный. Через некоторое время, не информируя животное, начинают подкреплять зеленый стимул. Многие виды животных обнаруживают способность улучшать решение таких задач при их повторении, то есть вырабатывают установку на научение.
Отсроченные реакции дифференцировки. Приманку на глазах у животного помещают под один из двух предметов. Через длительный промежуток времени животное должно выбрать стимул, который подкрепляется.