Основные идеи. Бихевиоризм (от англ. behaviour — поведение) использует для объяснения два основных понятия: стимул (S) и реакция (R)

Бихевиоризм (от англ. behaviour — поведение) использует для объяснения два основных понятия: стимул (S) и реакция (R). Сознание и прочие субъективные понятия отрицаются, бихевиоризм стремится иметь дело только с наблюдаемыми фактами, каковыми являются стимулы и реакции. В этом смысле поведение, сколько бы оно ни было сложным, может быть исследовано, как и любой другой наблюдаемый феномен.

По Скиннеру, личности как изолированной самости нет места в научном анализе поведения. Личность определяется им как сумма паттернов поведения. Паттерном поведения называется некоторая целостная совокупность поведенческих реакций. Различные ситуации вызывают различные паттерны реакций. Каждая индивидуальная реакция основана исключительно на пре-

дыдущем опыте и генетической истории. Автономный человек, свобода, достоинство, творчество, с точки зрения Скиннера, — только тонкие объяснительные фикции, также он отрицает спонтанность и источники поведения, лежащие вне жизненного опыта.

Если И. Павлов открыл механизм образования условных рефлексов (реакций) при сочетании безусловного рефлекса с некоторым условным сигналом, то Скиннер существенно расширил эту схему, предложив модель так называемого оперантного обусловливания — награждения за желательные и наказания за нежелательные реакции.

Если Павлов присоединял к старой реакции новый стимул, то бихевиористов интересовало прежде всего образование новых реакций. Желательные или целесообразные реакции могут получиться случайно (метод проб и ошибок) или могут быть вызваны намеренно (например, с помощью словесной инструкции у человека), но подкрепляющий стимул, даваемый после их получения, способствует их закреплению и повторению. Наказание (или негативный подкрепляющий стимул) уменьшает вероятность нежелательных реакций. Позитивные и негативные подкрепляющие стимулы регулируют поведение и управляют им. В природе естественным образом подкрепляются правильные, способствующие решению задачи реакции и наказываются неправильные.

Первичные подкрепители — это прямые физические вознаграждения. Вторичные подкрепители — нейтральные стимулы, которые ассоциируются с первичными подкрепителями, так что сами начинают действовать как награды. Деньги или обещание денег — один из примеров вторичного подкрепления.

Скиннера больше интересует управление поведением, чем его предсказание. Он считает, что «мы не можем принимать мудрые решения, если мы продолжаем притворяться, что человеческое поведение неуправляемо, или мы отказываемся заниматься управлением, когда могут быть достигнуты ценные результаты. Такие меры только ослабляют нас, оставляя силу в руках других. Первый шаг к защите от тирании — это максимально возможное обнаружение техники управления» [3].

Главный вывод, который сделали бихевиористы из тщательно проведенных экспериментов, — награждение обучает лучше, чем наказание!

Наказание информирует наказуемого о том, чего не надо делать, но не сообщает, что делать. Оно не дает возможности человеку научиться тому, какое поведение в данной ситуации является лучшим. Это основное препятствие эффективному обучению, тем более что неверных форм поведения гораздо больше, чем правильных.

Пример.

Надень рождения к подруге мама привела семилетнего сына в прекрасном чистом костюмчике с галстуком. По всему было видно, что его тщательно инструктировали, как надо себя вести за столом. Он старался вести себя как истинный джентльмен, но попал в затруднительное положение, стольхарак-терное для маленькихдетеи. Когда на тарелке осталось несколько горошин и кусочков жареной картошки, он никак не мог поймать их вилкой. Он было хотел сделать движение большим пальцем другой руки, чтобы загнать непокорные горошины на вилку, но, видно, ему это было категорически запрещено. Поэтому он делал небольшие движения большим пальцем, но тут же останавливался. Он задумался, и тут его осенило! Он помог горошку с помощью локтя своего прекрасного костюмчика (ведь это же не запрещалось!).

Пример.

В маршрутном такси бабушка разговаривает с внучкой примерно четырех лет. Внучка о чем-то громко спросила бабушку, но та то ли не услышала, то ли не захотела отвечать. Внучка очень звонко спрашивает бабушку: «Бабушка, ты что, оглохла?! Я тебя спрашиваю, а ты не отвечаешь...»

Бабушка очень спокойно и выдержанно: «Так нельзя говорить бабушке: "Ты что, оглохла?"»

— (Так же звонко.) А как?

— Так нельзя говорить бабушке: «Ты что, оглохла?»

— А как?

— Так нельзя говорить бабушке...

— А как?

И так далее... Пока маршрутка не остановилась на конечной остановке.

Наказываемые способы поведения не исчезают; они почти всегда возвращаются, обычно замаскированные (сопровождаемые) другими способами поведения. Вспомните, что делают школьники, которых «гоняют» за курение в туалетах. Тюрьма — прекрасная модель, демонстрирующая неэффективность наказания. Другая сторона наказания состоит в том, что оно поощряет наказую-щего, развивая в нем тиранические навыки.

Наказание неэффективно прежде всего потому, что практически никогда не совпадает по времени с моментом совершения нежелательного действия, поэтому и животное (а также и человек), чье поведение пытаются изменить, не понимает наказание как следствие собственных действий, скорее наказание понимается им как месть и реванш, произвол со стороны наказующего.

Кроме того, наказание невозможно отменить, изменив поведение, ведь все уже совершилось. Поэтому изменений и не происходит, единственное изменение состоит в том, что человек (или животное) стремится больше не попадаться. Наказуемые формы поведения возвращаются потом в скрытой или завуалированной форме. Как говорил Б.Ф.Скиннер, успехи мизерны, но вера в наказание безгранична.

3 Л и иле

Награждение правильных ответов существенноулучшает обучение. Это более эффективно, чем управление посредством наказания, поскольку награждение направляет поведение к цели. Гораздо легче обучить человека или животное желательному поведению, которое делает нежелательное поведение ненужным и даже невозможным, чем бороться с его нежелательным поведением. Награждение, если оно совпадает по времени с совершаемым действием, является мощнейшим способом его закрепления. Оно побуждает человека повторять данное действие и развивает стремление продолжать обучение. Что немаловажно, награждение делает добрее самого обучающего.

Пример.

В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила из клетки в вольер для того, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось (выделено мной. — Н.Л.). Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена [2].

Конкретные эксперименты на животных показали, что обучение с помощью наказания более длительно, чем с помощью награждения, и полученные навыки быстро забываются.

Награждение хорошо сочетается с нейтральными стимулами, такими, например, как деньги, которые затем становятся вторичными подкрепителями.

Пример.

Если тренер хочет приучить дельфина высоко прыгать на середине бассейна, то вряд ли он сможет подвесить рыбку именно там на должной высоте. Если же дельфина кормить после прыжка, когда он подплывет к краю бассейна, то он поймет, что его награждают за то, что он подплыл к тренеру. Поэтому во время кормления тренер свистит в свисток и дельфин приучается, что свисток — это награда. Теперь, когда он выпрыгивает из воды, его награждают свистком, потом награждают только за высокие прыжки на середине бассейна и т.д. Это оказалось вполне эффективным методом обучения.

Награждение очень селективно, оно ведет прямо к цели, показывает, как надо делать.

Пример.

В свое время, пользуясь этим методом, я быстро обучил своего сына 2,5 лет собирать мозаику (пазлы) по заданной картинке. Он, конечно, не знал, как за это взяться, и боялся неудачи. Я посадил его ксебе на колени, собрал при нем половину картинки, затем взял деталь мозаики, подставил ее к правильному месту и сделал вид, что не знаю, куда ее положить: «Куда же ее деть? Куда же?» «Вот сюда», — подсказал он. «Молодец! А я-то не знал». Следующую деталь также и т.д. Каждый раз — щедрая похвала. Так продолжалось несколько дней, затем посредине работы я говорю: «Извини, у меня дела, я скоро приду». Смотрю — сидит, собирает целый час самостоятельно, раньше столько и не заставишь высидеть ни за каким занятием. Все собрал сам. Тогда еще более щедрая похвала. С тех пор с этим делом не было никаких проблем: новые картинки собирались моментально, и это стало увлечением на несколько лет. Другие ребята не знали, как подступиться к этой задаче и в 5, и даже в 7 лет.

Известен опыт применения так называемых жетонов Скинне-ра в тюрьмах и в психиатрических лечебницах. Эти жетоны выдавались заключенным или больным за одобряемое поведение. Потом они обменивались на желательные для субъекта ценности (сигареты, билеты в кино, краткий отпуск и т.д.). Эксперименты показали весьма существенное изменение поведения и у тех и у других в лучшую сторону.

На принципах выработки необходимых навыков и награждении построено и программированное обучение по Б. Ф. Скиннеру. Суть этого метода состоит в том, что весь объем учебного материала, который должен быть усвоен, делится на мелкие порции, каждую из которых легко понять, затем идут проверочные упражнения, включающие систему подсказок (предлагается выбор из нескольких вариантов ответов). После решения задач можно переходить к следующей порции знаний. Обучаемый всегда получает положительное подкрепление, поскольку легко усваивает небольшой «кусочек» знаний и справляется с заданиями, исключается риск, что он будет решать задачу, не соответствующую его уровню знаний. Каждый может идти в своем темпе, если необходимо, можно легко вернуться к непонятому материалу. Особенно эффективно такое обучение благодаря использованию компьютера, скорость обучения возрастает порой в 10 раз.

Система обучения во многих школах также сейчас основывается только на системе наград и поощрений, что приводит к повышению успеваемости и к удивительному рвению учеников.

Кроме награждения и наказания существуют и другие формы управления поведением (см.: Прайор К. Не рычите на собаку! — М., 1995), например, отрицательное подкрепление. Это неприятное воздействие на индивида, но в отличие от наказания оно не наносит ему серьезного ущерба, происходит в момент совершения нежелательного действия, субъект воспринимает его как след-

ствие собственных действий, а главное, этого воздействия можно избежать, изменив свое поведение. Например, если студенты шумят во время семинара, можно громко звонить в колокольчик до тех пор, пока они не замолчат, но как только их поведение изменится, воздействие тоже должно прекратиться.