Общая характеристика процесса научения
При цирковой дрессировке, рассчитанной на зрелищный эффект, раньше практиковался преимущественно болевой метод — наказание животного за каждое неправильное движение. В настоящее время его в основном сменил гуманный метод дрессировки, основанный на учете особенностей естественного поведения животного, его предварительном приручении, хорошем с ним обращении и пищевом подкреплении правильно выполняемых движений. Иногда применяется смешанный метод — поощрение правильных и наказание за неправильные движения.
Дрессировка является значительно более сложным процессом, чем простое обусловливание, и не сводится лишь к выработке цепей условных рефлексов. Специфическая трудность заключается в том, чтобы дать животному понять, что от него требуется, какие движения оно должно выполнить. Между тем эти движения хотя и входят в видотипичный репертуар поведения, являются зачастую непривычными или трудноосуществимыми в заданных дрессировщиком условиях. Советский зоопсихолог М.А.Герд, детально разработавшая теорию дрессировки, делит поэтому процесс дрессировки на три стадии: наталкивания, отработки и упрочения.
На первой стадии решается задача — вызвать впервые ту систему движений, которая нужна человеку, «натолкнуть» животное на ее выполнение. Это достигается тремя путями: путем непосредственного наталкивания, косвенного наталкивания или сложного. В первом случае дрессировщик заставляет животное следовать или поворачиваться вслед за пищевым или иным привлекательным для животного объектом. Во втором случае провоцируются движения, непосредственно не направленные на приманку, но обусловливаемые общим возбуждением животного. Так, например, для создания циркового номера (раскатывание ковра лисицей) дрессировщик, стоя около свернутого ковра, поддразнивает ее куском мяса, но не дает схватить его. Возбужденное животное подскакивает, привстает, перебирает передними лапами и т.д. Все случайные прикосновения к ковру при этом закрепляются небольшими кусками пищи, в результате чего лисица все чаще будет обращаться к ковру, и, наконец, появятся нужные дрессировщику движения лапой по ковру. В дальнейшем эти движения отрабатываются, направляются на середину рулона и т.д.
При сложном наталкивании, по Герд, дрессировщик вначале вырабатывает у животного определенный навык, а затем изменяет ситуацию, заставляя животное по-новому применять выработанное умение. Так, балансирование мячом на кончике носа вырабатывается у морских львов после того, как они научились сбрасывать его в руки дрессировщику. Убирая руки из поля зрения зверя, пряча их за спину, дрессировщик заставляет его несколько задерживать мяч на кончике носа, ибо подкрепление (рыба) будет получено животным лишь после того, как мяч окажется в руках человека. Путем обильного подкрепления постепенно увеличивается длительность удерживания мяча, и в конечном итоге получается знаменитый коронный цирковой номер.
Вторую стадию дрессировки, стадию отработки, Герд определяет как этап, на котором совершается отсечение многих лишних движений, вначале сопровождающих необходимые действия животного; далее — отшлифовка первичной, еще весьма несовершенной системы движения и, наконец, выработка удобной сигнализации, с помощью которой дрессировщик в дальнейшем управляет поведением животного. Усилия дрессировщика на этой стадии направлены на упразднение ориентировочных реакций, движений, обусловленных страхом, и иных помех, а также на упорядочивание последовательности, направленности и длительности вырабатываемых движений. Необходимо также заменить реакцию на пищу реакцией на подаваемый дрессировщиком сигнал. При всем этом вновь используются некоторые приемы наталкивания. Например, чтобы отшлифовать у медведя удерживание бутафорного «торта», используется «дробное» наталкивание: дрессировщик поднимает пищевую приманку на нужную высоту и относит ее чуть вбок, в результате чего коробка, которая раньше прижималась медведем к низу живота, поднимается им на уровень груди и немного в сторону. Это правильное положение фиксируется минимальным или средним подкреплением. Равным образом правильная осанка медведя фиксируется приманкой, удерживаемой над его головой и т.д. С помощью наталкивающих воздействий производится и выработка искусственной сигнализации.
Заключительная стадия процесса дрессировки, стадия упрочения, характеризуется усилиями дрессировщика, направленными на закрепление выработанного навыка и надежность его воспроизведения в ответ на подаваемые сигналы. Дробное наталкивание (приманивание) применяется уже крайне редко, а пищевое подкрепление осуществляется уже не после нужного элемента навыка, а преимущественно после целого комплекса выполненных движений. Вообще кормление производится реже, но более крупными порциями. Выработанные в результате навыки приобретают стереотипную форму, при которой конец одного действия может послужить сигналом к началу последующего.
4. Познавательные процессы при формировании навыков
Еще в начале нашего века сложилось мнение, что образование навыков — как в отношении ориентации среди элементов среды, так и в отношении формирования новых сочетаний движений — происходит путем «проб и ошибок». К этому выводу пришел в результате своих исследований ряд выдающихся ученых — Г.Спенсер, К.Ллойд-Морган, Г.Дженнингс, и, прежде всего, Э.Торндайк. Согласно концепции «проб и ошибок», животное запоминает то, что случайно привело к успеху, все остальное постепенно отсеивается. Иными словами, в результате «проб и ошибок» совершается отбор и закрепление случайно произведенных удачных движений, что и приводит в конце концов путем многократных повторений к формированию двигательного навыка. Конечно, при этом отсутствует какое бы то ни было понимание связей и отношений между компонентами научения. Существенным здесь является представление, что «пробы и ошибки» совершаются беспорядочно.
Однако, образование навыков является значительно более сложным процессом и определяется активным отношением животного к воздействующим на него факторам среды. Еще в 20-е годы Э.Толмен, В.П.Протопопов и другие возражали против представления о хаотичности движений, производимых животными при решении задач, и показали, что эти движения формируются в процессе активной ориентировочной деятельности. При этом животное анализирует ситуацию и избирает то направление движений, которое соответствует положению «цели». В результате движения животного становятся все более адекватными ситуации, в которой дана задача. Таким образом, на место случайного возникновения движений ставится, как решающий фактор, активный двигательный анализ ситуации.
Этот взгляд получил подтверждение в ряде экспериментальных исследований. Так, американский ученый И.Ф.Дэшиелл показал, что пробные забеги крыс в тупики лабиринта вовсе не случайны, а, как правило, производятся в сторону «цели»: после первой ориентировки в лабиринте животное создает как бы общую систему направления своего передвижения; при этом крыса значительно чаще заходит в тупики, расположенные по направлению к цели, чем расположенные в обратном направлении.