Оперантное обусловливание

Для понимания сущности закона эффекта Торндайка. нам необходимо дать четкое определение понятия «ве­роятность реакции». Это очень важное понятие, но, к со­жалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «располо­женности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?

Если бы определенное поведение существовало в двух ипостасях - в одном случае оно всегда бы имело место, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характе­ристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является пред­положение, что вероятность осуществления реакции по­следовательно распределяется между этими двумя по­люсами «все - ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения, «не являясь причиной данного пове­дения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.

Распространенные выражения, отражающие вероят­ностную природу явления, — «тенденция» или «пред­расположенность» — характеризуют частоту наступле­ния определенных видов поведения. Мы никогда не на­блюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потому что замечаем, что он часто играет в бридж и часто говорит о нем. «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. «Неисправимый игрок» много играет в карты. Любитель киносъемок делает •снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д.

Характеризуя поведение человека с точки зрения его 'частоты, мы принимаем определенные стандартные ус­ловия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, на­сколько сильна тяга человека к музыке, если ему при­ходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или, по крайней мере, со­храняем в неизменном виде любое условие, которое спо­собствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдель­ный ящик, и за его поведением наблюдают с по­мощью одноканального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.

Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему" испытуемо­му еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъ­явлении подноса животное, вероятно, будет реагировать на него различными поведенческими реакциями, кото­рые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без про­медления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от пове­дения и наблюдать его результат.

Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и кото­рый легко поддается наблюдению и регистрации. На­пример, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удоб­ным поведением для изучения. Оно может быть зафик­сировано взглядом ^экспериментатора на шкале, при­крепленной к задней стенке ящика, на фоне которой на­ходится голубь. Сначала мы изучаем естественную вы­соту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, эксперимен­татор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если экс­перимент проводится в соответствии со спецификация­ми, то получается один и тот же результат: мы наблю­даем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем тень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы вы­брали вначале.

Когда мы демонстрируем процесс запечатления вотносительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие го­ловы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «науче­ние» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания щеп», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вы­тягивать шею - значит просто обращаться к объясни­тельным вымыслам, поскольку единственным доказа­тельством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса 'является следующее: мы делаем данный контингент следствий зависимым от оп­ределенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово за­имствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула! Мы не изменяем среду обитания голубя для того, чтобы вызвать подня­тие головы. Вероятно, нельзя показать, что любой прос­той стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стиму­лов, но при этом отсутствуют отношения по типу «одно порождает другое». Поэтому термин «реакция» не впол­не адекватен, но он настолько укоренился, что далее мы будем его использовать.

Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только пред­сказать, что похожие реакции будут наблюдаться в бу­дущем. Поэтому единицей науки о прогнозировании яв­ляется не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный тер­мин показывает, что поведение «воздействует» на среду, генерируя последствия. Следствия опреде­ляют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагатель­ное (оперантное поведение), и как существительное обозначающее поведение, определенное данным следствием.

Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств, является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» на определенную высоту является частью поведения.

Традиционное употребление термина «научения» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминологии необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловловании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а ее предъявление, когда реакция «выделяется; является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление – высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.

Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством опе­рантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохра­няем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем ока­заться не готовыми к изменению в среде, например по­явлению нового автомобиля, нового друга, новых инте­ресов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобре­тая новые реакции и утрачивая старые. <...> Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: