Перейти к контенту →

Не рычите на собаку. О дрессировке животных и людей, и самого себя. Карен Прайор. Краткое содержание

Как влиять на поведение с помощью положительного подкрепления

Иногда, чтобы повлиять на другого человека, мы не можем придумать ничего лучше, чем ругаться, угрожать и лишать чего-нибудь ценного. «Не уберёшься в комнате, не пойдёшь гулять!» Другими словами, мы прибегаем к отрицательному подкреплению. Карен Прайор – дрессировщица касаток. В дельфинарии на Гавайях, где она работала, животных поощряли положительно – рыбой, поглаживаниями, игрушками или аплодисментами – и это приносило впечатляющие результаты.

Дрессировщица стала пробовать метод в других жизненных ситуациях – при воспитании детей, взаимодействии с коллегами, борьбе с вредными привычками – и убедилась, что положительное подкрепление всегда действует исключительно эффективно. Например, если вы отвечаете на звонки близких с радостью в голосе, тем самым вы их положительно подкрепляете. Очень вероятно, что они станут звонить чаще.

Эта книга о том, как применять положительное подкрепление и менять с его помощью поведение. Безусловно, тренировка – это не панацея от всех неприятностей. Она не поможет отучить ребёнка плакать (плач может быть сигналом более серьёзной проблемы), не спасёт от неудачной женитьбы, не вылечит от психического заболевания. Однако когда дело касается привычек, положительное подкрепление подходит как нельзя лучше.

Например, с помощью положительного подкрепления можно вылечить супруга от ворчливости, а детей от капризов; отвадить кошку прыгать на обеденный стол, а собаку попрошайничать во время обеда; сподвигнуть начальника регулярно индексировать вашу зарплату. Для этого нужно лишь подмечать поведение, которое вам нравится, и немедленно его подкреплять – элемент за элементом. Поведение постепенно изменится, незаметно для тех, кого вы «дрессируете». Этот способ работает лучше, чем крик и лишения.

Биографическая справка

Карен Прайор получила биологическое образование, много лет работала дрессировщицей в океанариуме «Жизнь моря», а также консультантом по дрессировке животных в Национальном зоопарке Вашингтона и дельфинариях по всему миру.

Итак, расскажем, что же советует Карен в своей книге.

Желательного поведения можно добиться двумя способами. Первый – положительное подкрепление – лакомство, похвала, любые приятные впечатления. Например, секретарь выбирает моменты, когда босс в хорошем расположении духа, и только тогда несёт бумаги на подпись. Постепенно босс начинает более дружелюбно общаться с секретарём, а во время подписания даже отпускает шутки. Секрет прост – благодаря стратегии секретаря босс «запомнил», что когда он подписывает бумаги, у него хорошее настроение, и теперь, видя секретаря с документами, невольно радуется.

Второй вид подкрепления – негативное – это всё то, чего человек стремится избежать, например, наказание, недовольное выражение вашего лица, писк в машине из-за неплотно закрытой двери.

Негативное подкрепление работает, как правило, недолго. Как только контроль (стимул) ослабевает, желательное поведение пропадает. Эффект от положительного подкрепления, напротив, более устойчивый. К тому же, с помощью негативного подкрепления нельзя выработать новый навык.

Как сформировать новое поведение

Выработка нового навыка начинается с наблюдения за естественным поведением животного или человека. Даже когда мы выполняем одно и то же действие, мы каждый раз делаем это немного по-другому. Дрессировщик (воспитатель) подкрепляет малейшие сдвиги в нужном направлении, и так шаг за шагом добивается сложной цели.

ПРИМЕР. Скажем, вы хотите обучить цыпленка танцевать – вращаться вокруг себя. Сначала наблюдайте за его естественными движениями и давайте подкрепление всякий раз, когда он случайно повернется налево. Вскоре цыпленок начнет поворачиваться налево гораздо чаще. Теперь надо подкреплять более избирательно – не все повороты налево, а только более выраженные, не меньше, чем на четверть круга. Когда такие движения станут преобладать, начните подкреплять только повороты на полкруга и более. Постепенно цыплёнок научится делать несколько полных оборотов на большой скорости за одно подкрепление – цель будет достигнута.

Подобным образом формируются различные навыки у человека – игра в теннис, печатанье на машинке, публичное выступление. Эти же правила действуют, когда мы хотим отказаться от определённого поведения: бросить курить, стать менее застенчивым, разумнее тратить деньги. Достижение цели во всех этих примерах зависит не от таланта, а от элементарной настойчивости. Практически любой человек может достичь совершенства в деятельности, если потратит на тренировки много времени. Однако это скучно.

Несколько хитростей, чтобы ускорить выработку навыка

Если программа обучения составлена грамотно, и каждый её этап имеет значение и правильно подкрепляется, то результат можно достигнуть гораздо скорее. Вот несколько приёмов, которые помогут ускорить обучение и надолго сохранить результаты.

1. Планка повышается понемногу. Обучаемому должно быть легко выполнить новое требование. Например, лошадь стабильно берёт барьер в два фута, иногда преодолевая планку в три фута. В этом случае можно поставить следующую цель на уровне 2,5 фута. Поднять барьер сразу до трех футов опасно, потому что успех перестанет быть стабильным.

Другой пример: отец отобрал у сына мотоцикл до той поры, пока подросток улучшит отметки в школе. Сын стал заниматься усерднее, и его оценки немного улучшились. Вместо того, чтобы поощрить первые результаты, отец сказал, что надо стараться ещё больше и не отдал мотоцикл. Не получив положительного подкрепления, подросток бросил заниматься и вернулся к прежним двойкам.

2. Каждому элементу поведения – свой отрезок времени. Нельзя обучить дельфина делать фонтан брызг одновременно и высоким, и направленным в определённую сторону. Сначала надо довести высоту до нужной отметки, затем приступить к отработке направления, и наконец, можно требовать выполнения обоих критериев вместе. Если не соблюдать это условие дрессировки, то животному будет сложно понять, чего от него хотят: сначала не дают рыбку, потому что фонтан низкий, потом опять не дают, хотя фонтан высокий (но не туда направлен).

Иногда мы делаем много упражнений, но прогресс очень медленный. Причина в том, что мы пытаемся улучшить сразу два или более элементов навыка. Например, распространённая ошибка при обучении игре в гольф заключается в том, что новичок старается сделать удар сразу и в меру сильным, и правильно направленным. На формирование этого навыка может уйти целое лето. Чтобы научиться играть в гольф всего за несколько выходных, надо действовать шаг за шагом.

Сначала надо отрабатывать только расстояние до лунки, затем – только направление удара и, наконец, оба элемента вместе. Для тренировки силы удара вы можете использовать шнур, отмеряющий расстояние, посылая мяч вдоль него. Для отработки направления удара можно очерчивать шнуром круг на земле и пытаться в него попасть, постепенно сужая пространство. Когда оба элемента будут выполняться на приличном уровне, можно объединять их в одну цель – удар определённой силы и в заданном направлении.

3. Заучивание лучше начинать с конца. Разделите стихотворение, мелодию, текст выступления или роль в пьесе на части и начните запоминать их в обратном порядке. Хитрость в том, что вы будете двигаться от незнакомого к тому, что уже выучили, а это психологически проще. Знакомый материал будет выполнять функцию положительного подкрепления.

4. Время для того, чтобы освоиться. Однажды приобретённый навык обычно не забывается, однако если задача усложняется или обстановка меняется, то мастерство может временно «пропадать». Был случай на генеральной репетиции оперы: хор делал много ошибок в пении, и дирижёр даже начал волноваться за премьеру. Причиной же сбоя были новые тяжелые костюмы, непривычное место (подмостки) и новые движения. Постепенно певцы освоились и стали петь так же чисто, как раньше.

Если прошло очень много времени, и вы не можете вспомнить, к примеру, стихотворение, иностранные разговорные фразы или технику езды на велосипеде, то стоит вернуться в самое начало – с чего вы начинали осваивать навык, и быстро повторить все этапы выработки. Освежив память, вы сможете вновь пользоваться «забытым» умением.

5. Обходиться без слов. Формировать поведение людей лучше так, чтобы они этого не замечали, то есть на несознательном уровне. Именно поэтому лучше избегать слов. Как только вы говорите вслух: «Ты получишь награду, если… уберёшься в комнате, перестанешь курить марихуану и пр.», обучение превращается в банальный подкуп. Человек, осознавая, что происходит, может нарочно поступать противоположным образом.

Тем более не стоит говорить вслух о том, что вам удалось изменить чужое поведение («Вот видишь, я научил тебя не курить, а ты даже не заметил!»). Человеку может не понравиться, что им «манипулировали», и он разрушит достигнутые результаты, даже если раньше сам к ним стремился.

6. Дневник своих достижений. Самое сложное занятие – обучать самого себя. Например, вы можете поставить перед собой цель следить за весом или не транжирить деньги. Обычно самообучение требует много времени (от года) и приходится перепробовать несколько методов, прежде чем найдётся тот, что сработает. Единственный безотказный приём подкрепления самого себя – это ведение дневника достижений и составление наглядных графиков улучшений. Когда кажется, что вы топчитесь на месте, достаточно взглянуть на график и увидеть, что сейчас ситуация всё же немного лучше, чем год назад.

Как правильно использовать положительное подкрепление

Положительное подкрепление – это очень естественная для каждого вещь. Не осознавая этого, мы сами везде ищем одобрения нашим действиям. Например, вы решаете на экзамене сложную задачу. Задумавшись, начинаете грызть карандаш, и в этот момент в голову приходит правильный ответ. Этого бывает достаточно для формирования стереотипа: вы и впредь станете грызть карандаш, когда нужно будет что-нибудь вспомнить или придумать.

Чтобы сознательно использовать положительные подкрепления и менять с их помощью поведение других людей и собственные привычки, следует соблюдать пять основных правил поощрения.

ПРАВИЛО 1. Подкрепление должно быть заслуженным и своевременным

Подкрепление – это сообщение другому человеку, что именно вам нравится. Оно должно следовать непосредственно за подкрепляемым действием. Так, во время тренировки инструктор восклицает «Да, хорошо!» именно в том момент, когда спортсмен делает правильное движение. И это ускоряет обучение.

Разбор достижений и ошибок в раздевалке, казалось бы, то же самое. Однако только с точки зрения информативности. А вот с точки зрения освоения нужного навыка, отсроченная обратная связь гораздо менее эффективна. То же самое с премиями за хорошую работу – если они выплачиваются по итогам года, то никто уже не вспомнит, что именно и когда было сделано правильно.

Запоздалое подкрепление. Мы часто опаздываем с подкреплениями: «Дорогая, вчера вечером ты выглядела замечательно». Впечатление от такого комплимента будет не таким сильным, как если бы его сделали вовремя – вчера вечером. В некоторых случаях запоздалое подкрепление может оказать даже противоположное действие: «А что, разве сейчас я не выгляжу замечательно?».

Опережающее подкрепление. Иногда родители слишком рано подкрепляют детей: «Молодец, хорошо, ты уже почти всё сделал правильно». В данном случае вы подкрепляете попытки, но не результат. Ещё хуже – не дождавшись завершения действия, обещать подарки. Ребенок будет уверен, что самое главное – попробовать, ну а если не получится, то ничего страшного, и не научится доводить начатое до конца.

Идеальное подкрепление. Пример самого эффективного немедленного подкрепления за результат – это аплодисменты и рёв трибун после забитого футболистами гола. Сами игроки также обмениваются мощными подкреплениями после очередного успеха – это улыбки, крик, объятия. Пожалуй, всё это стимулирует игроков даже больше, чем похвала тренера после игры.

ПРАВИЛО 2. Чем меньше подкрепление, тем лучше

В 1979 году в Национальном зоопарке в Вашингтоне крайне медленно продвигалось обучение панды. Разбор ситуации показал, что после каждого успеха, панде давали целую морковку, которую та смаковала минут 15. За время тренировки животное успевало заслужить поощрение всего три раза. К тому же морковь панде надоедала. Когда размер вознаграждения сократили до одного ломтика морковки, обучение пошло динамичнее – панда всё время хотела морковь и стала больше стараться.

 

Для поддержания интереса вполне достаточно одного зёрнышка для цыпленка, кубика мяса для кошки, половинки яблока для слона, чайной ложки зерна для лошади. В Национальном зоопарке Вашингтона обучили белых медведей переходить по команде в другую клетку за изюминки.

Исключение из правила. Конечно, чем сложнее задание, тем большего размера требуется подкрепление. Например, дельфинам дают большую макрель за семиметровые вертикальные прыжки, потому что за две маленькие корюшки они не хотят прыгать. В организациях так же – более сложные задачи вознаграждаются лучше, иначе нет желающих за них браться.

ПРАВИЛО 3. В схеме подкрепления должна быть интрига

Если давать дельфину рыбу за каждый прыжок, то скоро они станут невысокими и небрежными. А если перестать давать рыбу, дельфин вообще перестает прыгать. Согласитесь, напоминает ситуацию с регулярными выплатами премий на работе. Лучше не доводить ситуацию до такого финала.

Как только животное научилось прыгать за рыбку, подкрепление надо сделать вариативным, то есть не за каждый прыжок, а, например, за первый, потом за третий, потом за шестой и седьмой и т.д. При такой схеме дельфин хочет угадать, когда будет рыбка и очень старается прыгать хорошо. Подкреплять следует выборочно прыжки, которые удаются лучше.

Действенность вариативного подкрепления лежит в основе азартных игр. Если каждый раз, опустив жетон в автомат, вы получаете стандартный выигрыш, игра перестаёт быть интересной и превращается в скучный способ обогащения. Если же поведение не подкреплять никогда, то оно постепенно угаснет. А вот если подкрепление происходит время от времени, то поведение будет усиливаться. Так, если изредка уступать капризам ребёнка, то в следующие разы он будет клянчить громче и настойчивее. Если позволять себе изредка «всего одну сигаретку», то вы никогда не бросите курить.

Некоторые люди никак не могут расстаться с супругами, которые с ними скверно обращаются. В основе лежит то же вариативное положительное подкрепление. Скажем, вы вступили в связь с обаятельным и весёлым человеком, а затем он стал эгоистичным и обидчивым, но всё же время от времени проявляет хорошие качества. Результат будет парадоксальным с точки зрения здравого смысла, но закономерным с точки зрения теории обучения: вы станете жить ради этих моментов. Пусть редко, но вы получаете положительное подкрепление – часы, полные очарования и веселья. Причём чем менее предсказуемы и более редки такие моменты, тем мощнее их подкрепляющий эффект. Представьте себе жену алкоголика, которая говорит: «Когда мой муж трезвый, он добрый и заботливый» (и не важно, что трезвым он бывает пару раз в год).

ПРАВИЛО 4. Подкрепление на старте должно быть частым

Самое сложное – заставить себя начать что-то делать. Поэтому на старте особенно нужно подкрепление. Например, в серии из шести прыжков дельфины обязательно получают поощрение за первый прыжок (или за второй, чтобы сохранить интригу). Правило работает и с людьми, например, для самомотивации.

Автор книги рассказывает, что в течение нескольких лет она два раза в неделю посещала вечерние занятия в университете. Дорога занимала час в одну сторону, и выйти из дома в пять часов вечера было сложно, всегда находились предлоги, чтобы «только сегодня» пропустить занятие. Тогда автор придумала для себя схему положительного поощрения за старт – дорогу «туда».

Путь был разбит на пять отрезков: дорога до метро, посадка в поезд, пересадка, автобус до университета, лестница до аудитории. Каждый этап подкреплялся маленьким кусочком шоколада, который не входил в обычный рацион и употреблялся только по праздникам. С шоколадом дорога стала динамичнее и желаннее. Когда стрелки часов подбирались к пяти, возникало приятное предвкушение встречи с любимым лакомством. Через несколько недель оказалось, что выходить из дома стало легко даже без шоколада в сумке.

ПРАВИЛО 5. Резко улучшить результаты поможет приз «ни за что»

Один наездник так поощряет лошадь за сложный манёвр, который та выполнила впервые: соскакивает с неё, освобождает от седла и уздечки и выпускает на манеж. Неожиданная свобода – сильное положительное подкрепление. Неожиданный приятный стимул способен также нарастить активность, когда на протяжении долгого времени у животного всё получается, и привычное подкрепление перестаёт действовать.

Подарок «просто так» может также изменить поведение человека. Представьте, что родители трудного подростка, который увлекается верховой ездой, ни с того и с сего вручают ему билет на дополнительное занятие с личным тренером. Очень вероятно, что подросток от неожиданности перестанет грубить, по крайней мере, на время.

В мире бизнеса «нежданный куш» также работает. Одно рекламное агентство устраивало, кроме обычных праздников, одно-два внеплановых мероприятия в год. В разгар рабочего дня директор проносился по всем комнатам с криком, чтобы все заканчивали работу. После этого появлялись музыканты, официанты, угощение и начиналась вечеринка без повода. Это очень способствовало поднятию духа в коллективе.

5 позитивных способов избавиться от нежелательного поведения

Выработать новое поведение бывает непросто, но ещё сложнее – избавиться от уже сложившихся привычек, например, отучить неряшливого соседа разбрасывать вещи или угомонить орущих детей в машине.

Существует несколько способов избавиться от нежелательного поведения. Мы не будем говорить о наказаниях и других отрицательных подкреплениях, потому что они ничему не могут обучить, а лишь прекращают поведение. Например, вы можете развестись с супругом, но это не научит его верности; вы можете увести ребенка с праздника за плохое поведение, но это не привьёт ему хорошие манеры. Тот же нулевой эффект вы получите, если уволите сотрудника за опоздания или усыпите кошку за то, что она мочится на кухонную плиту.

Даже если наказание не такое радикальное (например, мы ограничились угрозами), оно, как любое отрицательное подкрепление, не помогает обучить субъекта желательному поведению. Например, кошки вообще не ассоциируют наказание с проступком – они только пугаются, но ничему не учатся. Однако с помощью положительного подкрепления можно добиться от них очень многого. Кстати, чувство вины – это разновидность отрицательного самоподкрепления, которое мало помогает, например, бросить курить.

Рассмотрим позитивные методы, которые способны обучить.

МЕТОД 1. Никакого подкрепления

Если поведение не подкрепляется, оно исчезает. Этот метод лучше всего работает в случае ворчания, хныканья, угроз. Если они не вызывают никакой реакции, то угасают. Игнорируя поведение (но не игнорируя при этом самого человека), можно сделать так, что многие неприятные проявления угаснут сами собой, потому что не будут приводить ни к какому результату: ни к хорошему, ни к плохому.

Например, если супруг обычно возвращается домой в плохом настроении, старайтесь, чтобы его грубости не давали никаких результатов: ни хороших, ни плохих. Другими словами, не старайтесь угодить ему во всём, но и не делайте ледяного выражения лица. Ведите себя как ни в чём не бывало.

МЕТОД 2. Несовместимое поведение

Если вам не нравится, что собака попрошайничает у стола, обучите ее лежать на пороге столовой пока вы едите (вместо того, чтобы прогонять и наказывать). Сначала просто научите её ложиться по команде (первый элемент поведения), затем – ложиться в любом месте столовой, пока вы едите, и наконец – ложиться именно на пороге. Начните с конца – в первые дни тренировки давайте команды и подкрепляйте собаку пищей, когда вы уже закончили обедать. Когда она научиться ложиться по команде на пороге, используйте этот навык во время трапезы. Лечь на пороге и попрошайничать у стола – два несовместимых поведения, поэтому второе (неподкрепляемое) угаснет.

Автор приводит забавный музыкальный пример. Хор исполнял один такт в укороченном виде и вступал в диссонанс с оркестром. Дирижер дал им задание усилить звук «з», который был в тексте этого такта. Удлинение этого звука (жужжание) было несовместимо с ускоренным исполнением такта, и проблема была решена.

А вот пример с детьми. Если они балуются и ругаются в машине, начните с ними играть в «Города», или петь песни, или рассказывать стишки-загадки. Всё это несовместимо с перебранкой и криками.

МЕТОД 3. Условный сигнал

Если привязать нежелательное поведение к какому-нибудь условному стимулу (например, хлопку или выкрику), а затем убрать этот стимул, то поведение угаснет. Например, обучите собаку лаять по команде «Голос!» за что-нибудь вкусненькое. Без команды (и, соответственно, без подкрепления) лая не будет.

Точно так же можно призвать разбушевавшихся детей в машине поднимать шум по команде: «А теперь все кричим, кто громче!». Двух-трёх команд бывает достаточно, чтобы дети «проорались» и им стало неинтересно кричать по команде. Остаток пути пройдёт в относительной тишине.

МЕТОД 4. Подкрепление всего, кроме нежелательного поведения

Зоопсихолог Гарри Фрэнк брал в дом волчат. Чтобы те ничего не испортили, он подкреплял лаской любое неразрушительное поведение. Правда, в моменты, когда волчата ничего не грызли, они вообще ничего не делали – просто лежали. Другого неразрушительного поведения они не демонстрировали, поэтому пришлось подкреплять лежание. Со временем Гарри, его жена и трое молодых волков могли подолгу лежать вместе и смотреть телевизор.

Этот метод можно применить, чтобы повернуть в позитивное русло разговоры со старым больным родственником. На все жалобы и слезы реагируйте нейтрально: «А», «Хм», «Да, да». Не подкрепляйте это поведение ни положительно (сочувствие, ласковый голос), ни отрицательно (раздражение, бросание трубки). Всё, что не является жалобой, щедро подкрепляйте радостью и энтузиазмом – вопросы о детях, новости, разговоры о погоде и пр.

МЕТОД 5. Смена мотива

Человек, у которого достаточно еды, не станет воровать краюшку хлеба. Если вам удаётся выяснить и устранить базовый мотив нежелательного поведения, очень вероятно, что вам удастся с ним справиться. Например, если ваш малыш устраивает скандалы в магазине, попробуйте для начала хорошенько накормить его перед походом за покупками. Возможно, причина истерик – голод, а в магазине столько вкусных запахов, которые сводят с ума…

Жевание резинки и курение – примеры самоподкрепляемого поведения (нас мотивирует сам процесс). Избавиться от подобных привычек помогает новая мотивация. Например, на подростка может подействовать замечание, что девочки, жующие резинку, выглядят вульгарно. Не выглядеть «вульгарно» может оказаться важнее, чем получить удовольствие от жевания. Курильщики часто отказываются от своей привычки, опасаясь заработать рак.

Вот ещё пара примеров того, как смена мотива помогает улучшить поведение. Если у вас никак не получается удар при игре в теннис, оставьте попытки поразить окружающих своим мастерством, играйте для собственного удовольствия. Если на работе один сотрудник ленится выполнять свои обязанности, введите оплату за сделанную работу.

Практический пример: как перестать опаздывать

Иногда человек опаздывает потому, что испытывает страх (например, перед школой) или неприязнь к людям, с которыми предстоит встретиться, – тогда он оттягивают неприятный момент. Другой мотив – желание получить сочувствие: «Посмотрите на меня, бедняжку, я ничего не успеваю!». И т.д. В любом случае, если вам удастся изменить мотивацию, изменится поведение.

Например, вы можете решить для себя, что отныне первостепенное значение в вашей жизни играет точность. Если вы решите стать точным для самого себя, остальные мотивы в разных ситуациях отойдут на второй план.

Попробуйте также все описанные методы. Например, выработайте несовместимое поведение (метод 2): назначайте себе более раннее время прибытия, возьмите за привычку приезжать к офису раньше, чтобы до работы выпить кофе в баре. Или попробуйте метод 3: выберите несколько событий, на которые вы можете опоздать, заранее объявите о своём опоздании и опоздайте. Как говорилось выше, поведение по сигналу затухает само в отсутствие сигнала. То есть преднамеренные опоздания вполне могут снизить частоту «случайных» опозданий.

Заключение

Если вы станете наблюдать за поведением любых существ и начнёте положительно подкреплять действия, которые вам нравятся, то очень скоро почувствуете, как можете управлять чужим поведением. И это без упрёков, криков и наказаний. Если даже цыплёнка можно научить танцевать, представьте, сколько возможностей открывается с людьми. Грамотное использование положительного подкрепления способно существенно улучшить ваши отношения с миром: усилить привязанности в семье, укрепить дружбу, привить детям хорошие манеры.

 

Опубликовано в Быстрый результат

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *