Положительное подкрепление в дрессировке собак: когда и как применять?

Джон Фишер. О чем думает ваша собака

5. Методика положительного подкрепления

Метод положительного подкрепления можно применять при дрессировке любых животных, но особенно он подходит для собак. Это система, целиком опирающаяся на побудительный мотив (стимул) и отвергающая физическое воздействие или силу в любых их проявлениях. Этим методом могут пользоваться даже дети. Он не требует какого-либо природного дара (таланта) дрессировщика. Он не связан с каким-то особым тоном, выбором подходящего времени, не основан на регулярной практике и не опирается на какую-либо из традиционных теорий дрессировки собак. Все, что требуется – ваш разум и какой-нибудь лакомый кусочек.

Как научить собаку, чтобы она по команде ложилась в каком-нибудь определенном углу комнаты? Для этого существует два способа:

1. Можно бить собаку плеткой всякий раз, когда она пойдет в какой-либо другой угол и вообще бить до тех пор, пока она не усвоит, что указанное вами место – единственное безопасное убежище.

2. Можно дать собаке особенно вкусный кусочек в этом уголке и полностью ее игнорировать, когда она пойдет в какую-то другую часть комнаты.

Я совершенно уверен, что, прочитав эти строки вы сказали себе: «Ну, это рассуждения на уровне здравого смысла. Что тут такого нового?» Разумеется, это здравый смысл. Каждый владелец собаки ежедневно поступает подобным образом и дома, и вне его стен, не задумываясь о том, что и как он делает. Хотя почему-то, когда требуется сделать некоторое усилие и чему-нибудь научить свою собаку, мы становимся в позу дрессировщика и вспоминаем стародавний подход: «Ты собака, я хозяин. Я приказываю, ты подчиняешься».

Когда дома вы подзываете собаку, вы обычно намерены покормить ее или взять на поводок и повести на прогулку, или показать, что вы уронили еду на пол в кухне и хотите, чтоб она все подчистила. Действительно, дома мы редко зовем собаку просто так, обычно это происходит по какой-то причине, и в большинстве случаев выполнение команды сулит собаке что-то приятное. В результате лишь немногие люди жалуются, что собака не идет на зов дома. А в ближайшем парке дело обстоит совсем иначе. Вы гуляете, она свободно бегает, играя с другими собаками, охотится за белками, роется в мусорных урнах, в то время как вы погрузились в собственные мысли. У ворот парка вы зовете ее, чтобы вести домой. И тут она, бросив на вас взгляд, направляется в противоположную сторону. (Такое все мы видим на улице чуть не каждый день.) В этот момент вы говорите себе: «Я должен наконец выдрессировать свою собаку». Вы ее уже выдрессировали. Вы преуспели в том, что научили ее не подходить к вам. Как? Очень просто. Собака быстро усвоила: если она не подойдет, то будет вознаграждена более длительной прогулкой. Если же она к вам подойдет, то лишится удовольствия: ее отведут домой.

Если бы вы применили ваши «домашние приемы» дрессировки команды «Ко мне!», подзывая пса около ворот, давая лакомство и затем делая еще круг по парку, то вскоре, услышав зов, он летел бы к вам пулей. Подкуп? Я называю это здравым смыслом. Сколько раз уже мне приходилось прятать улыбку, когда ко мне обращались люди, которые сталкиваются с проблемами нежелательного поведения своих собак, и я в ответ предлагаю им попробовать награждать собаку за хорошее поведение, вместо того чтобы думать, каким образом наказать ее за нежелательное поведение. Хозяева недоумевают: «Вы хотите сказать, что я должен его подкупать?» По-моему, это довольно забавно: то, чему ученые, психологи и бихевиористы (специалисты по проблемам поведения) придумали замысловатые названия вроде «модификации поведения», «реабилитационная психотерапия», «психология поведения» и так далее, широкой публикой все еще расценивается как подкуп.

Впрочем, на самом деле важно другое – при правильном применении положительное подкрепление весьма эффективно: оно изменяет нежелательное поведение. Существует ряд основополагающих принципов, которые определяют успех применения положительного подкрепления как метода дрессировки. Но прежде чем начать применять эти принципы или законы с помощью специальных обучающих упражнений в процессе дрессировки собак, необходимо рассмотреть отдельно каждую стадию обучения, ее цель и желаемый результат.

Как действует положительное подкрепление

Прежде всего мы вообще должны забыть об упражнениях. Все, что нас интересует для начала – это первый шаг в нужном направлении. Представим себе, например, что мы хотим научить касатку выпрыгивать из воды. Мы даем свисток (команду) и ждем. Затем ждем еще немного, а зачастую бывает, что ждем еще и еще. Очевидно, сначала касатка не имеет представления о том, что от нее требуется, когда звучит свисток. Поэтому нам приходится ждать, чтобы она зачем-нибудь высунула нос из воды. Точно в этот миг мы снова свистим в свисток и даем ей рыбу. Когда она проплывает внизу, мы снова свистим и ждем. Процедура повторяется до тех пор, пока касатка не выйдет на уровень «ага!»: «Ага! Когда я слышу звук свистка, я получаю рыбу». Этот уровень понимания – уровень «ага!» – не может считаться закрепленным, до тех пор вы не добьетесь, чтобы происходило десять из десяти возможных немедленных реакций на свисток. Пока это не достигнуто, не следует переходить к следующему этапу дрессировки.

На первом ее этапе кажется, что прогресс не очень заметен, однако для успеха обучения крайне важно, чтобы каждый этап заканчивался достижением уровня полного понимания. Если вы этого добьетесь, то обнаружите, что, по мере перехода к каждому следующему этапу превращение первоначальной реакции в распознаваемую цепочку движений идет очень быстро. Теперь мы подходим к этапу дрессировки, который называется «формирование». Нам нужно заменить уже сложившуюся цепочку: «свисток – появление носа – обязательная рыбка», новой цепочкой: «свисток – касатка выпрыгивает из воды – рыбка дается иногда». Достигается это следующим образом. Формирование поведения означает, что мы делаем один маленький шаг в нужном направлении и продвигаемся к конечной цели, подкрепляя каждый сделанный шаг. Так мы обеспечиваем безусловное выполнение этой части цепочки, прежде чем двигаться дальше.

Здесь наблюдается интересное явление: выполнение определенных действий, надежно затренированное с помощью вознаграждения, можно сделать еще более четким, если вознаграждение задерживать. Предположим, затренирована такая реакция касатки: на десять свистков она десять раз немедленно высовывает нос из воды. На одиннадцатый раз говорим: «Недостаточно хорошо, рыбы ты не получишь». Можно предположить, что теперь касатка подумает: «Но я всегда получаю рыбку. Наверное, кто-то ее стащил раньше меня. В следующий раз надо живее пошевеливаться». И на двенадцатый раз вы получите более быструю и энергичную реакцию касатки: она высунет из воды всю голову целиком. За это безусловно полагается рыбка, но теперь и в дальнейшем – только за это.

Дальше будем формировать цепочку: «свисток -появление из воды всей головы целиком – при немедленной реакции рыбка в награду в десяти случаях из десяти». Лишь затем можно будет перейти к следующему этапу. Кажется, что обучаемый с каждым этапом все скорее понимает, что от него требуется и возникает эффект снежного кома.

Я намеренно воспользовался примером касатки чтобы подчеркнуть главное: весь процесс обучения может осуществляться без какого-либо физического воздействия. Сначала мы ждем верного шага в нужном направлении и вознаграждаем его, затем закрепляем и придаем законченную форму.

Хозяин: «Какая разница между всем этим и подкупом?» Я: «Подкуп – это использование награды в качестве соблазна, для того чтобы стимулировать движение. Подкрепление – это вознаграждение, получаемое за добровольное движение». Хозяин: «Всегда ли давать награду?» Я: «Прием действует лучше, если вы даете награду не всегда. Когда модель поведения сформирована, только самая быстрая, ярко выраженная и сильная реакция вознаграждается. Иногда ученику придется выполнить отработанную цепочку шесть или семь раз, прежде чем последует вознаграждение». Хозяин: «Обязательно ли давать в награду что-то съедобное?» Я: «Наградой может быть что-то другое, ради чего, с точки зрения ученика, стоит выполнять определенные действия. Было бы бессмысленно пытаться сформировать мое поведение с помощью тарелки капусты, если я терпеть не могу капусту!

Как применять положительное подкрепление

В главе «Как учатся собаки» я рассказал о том, как научил свою первую собаку искать и приносить вещь (соответствует команде «Аппорт!»). Теперь я расскажу вам, как я научил выполнять это задание свою нынешнюю собаку. На обучение моей первой собаки ушло несколько недель, и она так и не научилась выполнять команду по-настоящему хорошо. Это была немецкая овчарка – порода славится хорошей обучаемостью. Моя теперешняя собака выполняет то же задание с огоньком в глазах и невероятной для собаки ее размеров быстротой. Это – японская акита, порода, известная своим упрямством.

Я провел много времени на дрессировочной площадке, в течение ряда недель обучая мою немецкую овчарку. В течение нескольких дней, затрачивая по несколько минут в день, я обучил акита, ни разу даже не встав с кресла. Используя этот метод, я недавно помог проводнику полицейской собаки достичь того же результата при дрессировке немецкой овчарки. Фактически нам потребовалось меньше обычного времени, чтобы довести совершенно необученную собаку до стандарта министерства внутренних дел, причем достигнутые результаты были гораздо выше тех, которых добиваются, применяя обычные методы дрессировки.

Кличка моей собаки – Йоко. Поняли? Джон Йоко. Ей было пятнадцать месяцев, когда я реши научить ее искать и приносить брошенный предмет. Сейчас у меня не остается времени, чтобы самому участвовать с моими собаками в соревнованиях, где собаки демонстрируют свои умения, но я все еще сужу такие состязания. И вот однажды один хозяин-участник обронил мимоходом замечание, которое побудило меня учить мою собаку искать и приносить брошенный предмет. Парень сказал: «Вы никогда не научите акита выполнять эту команду как следует». Когда мне бросают вызов, я загораюсь.

Я сидел за письменным столом в своей приемной, рядом на столе я поставил коробочку с лакомством. Протягивая собаке гантель, я говорил: «Возьми!» Йоко нюхала перекладину, а я говорил: «Хорошая девочка!» – и давал ей угощение. Первое занятие продолжалось около пяти минут, и она получила вознаграждение сразу после быстрой реакции примерно в 60% случаев. В остальных случаях за правильные реакции иногда тоже давалось вознаграждение, но только после того, как собака нюхала стол, карабкалась на меня, лаяла или делала еще что-нибудь, стараясь получить вознаграждение. На следующем занятии в тот же день был достигнут уровень понимания (уровень «ага!»). Йоко тыкалась носом в гантель всякий раз, когда я давал команду. На формирование действия и переход к следующей стадии потребовалось несколько больше времени. В течение четырех занятий по пять минут каждое она пробовала делать самые разные вещи чтобы получить награду. Отношение было: 15%; 25%; 70%; 100%. Теперь я уже требовал, чтобы она не тыкалась в гантель носом, а лизала ее. Не дав ей угощения, когда она в очередной раз лизнула гантель, я попал в точку, что вызвало эффект снежного кома гораздо раньше, чем я сам того ожидал. Она решительно выхватила гантель у меня из рук смотрела на меня, как будто говоря: «Смотри, глупыш, я ее взяла. Давай еду!»

Никто не может заранее определить модель формирования поведения при выполнении задания. Мы можем запланировать известную структурированную последовательность, но при обучении нам придется руководствоваться темпом, который установит само животное. После того как вы вознаградили собаку за определенное движение, оно должно стать единственным движением, за которое дается награда, пока оно не будет затренировано. Йоко сделала больший шаг вперед, чем я ожидал, и, поскольку я ее с энтузиазмом наградил, мне пришлось ждать, чтобы она его повторила. Это отняло меньше времени, чем я ожидал, но надо учесть, что Йоко очень прожорливая собака.

После такого огромного рывка вперед вся цепочка действий формировалась очень легко. Прошло совсем немного времени, и я уже бросал гантель на кушетку в дальнем конце приемной, а Йоко приносила ее по команде и садилась передо мной, держа ее в зубах, гордая. В первый же раз, когда на свежем воздухе я опробовал дать одно из тех упражнений, что предлагаются на состязаниях, она получила бы у меня за их выполнение все десять баллов из десяти. Но кажется, я несколько пристрастен.

Возьмем теперь два простых действия: выполнение команд «Сидеть!» и «Лежать!». Попытаемся, используя наш метод и не применяя силу, научить собаку четко реагировать на данные команды. Чтобы ускорить процесс, необходимо прибегнуть к подкупу. Иными словами, мы показываем награду, чтобы стимулировать движение. Как только достигается этот уровень понимания, мы обращаемся к команде и подаем ее только голосом, затем ждем, чтобы было сделано верное движение. Тогда мы придаем этому движению законченный вид. Для отработки команды «Сидеть!» покажите собаке лакомство, даже дотроньтесь им до кончика ее носа. Скажите: «Сидеть!» – и медленно переместите лакомство вверх и назад, чуть дальше линии глаз собаки. Сложение у собак такое, что если голова поднимается вверх и назад, то задняя часть туловища непременно опускается.

Для отработки команды «Лежать!» выберите такое препятствие, чтобы для его преодоления собаке нужно было лечь на брюхо. Это будет зависеть от размера собаки. Например, для немецкой овчарки подошел бы кофейный столик. Подведите к нему собаку и предложите ей лакомство, держа его в руке под столиком, то есть под препятствием. Когда собака потянется за лакомством, медленно отодвигайте его под препятствием, побуждая собаку двигаться следом и командуя при этом: «Лежать!» В тот момент, когда ее брюхо коснется пола, дайте вознаграждение.

Теперь, когда мы научили свою собаку делать то, чего мы от нее добиваемся, остается отучить ее делать то, что нам не нравится. Для достижения этой цели используем систему отрицательного подкрепления.

Что такое положительное подкрепление

Что такое положительное подкрепление

Положительное подкрепление — это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия.

Запомните это положение. В нем заложен секрет успешного обучения.

Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление — это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление — это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, — это отрицательное подкрепление).

Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам — ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с подкреплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно, если вы примените отрицательное подкрепление — «Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь» и т. д., замечания, которые вызывают раздражение, — вы создаете ситуацию, при которой звонящий избегает неприятностей тем, что не звонит; фактически вы обучаете их не звонить. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В научной психологической литературе встречаются такие выражения: «Были использованы поведенческие методики» или «Проблема была решена с помощью поведенческого подхода».

Обыкновенно это означает, что они отдают предпочтение положительному подкреплению перед другими использованными ими методами. Это совсем не означает, что они использовали весь арсенал приемов, описанных в этой книге; они могут и не знать о них. Однако введение положительного подкрепления часто является единственно необходимым мероприятием. Кстати, например, наиболее действенный способ приучить ребенка не мочиться в постель — лично похвалить его и выразить свое удовольствие, если утром простынки оказались сухими. Положительное подкрепление можно применить и к себе. В Шекспировской студии, которую я в свое время посещала, я встретила юриста с Уолл-стрит, которому было под пятьдесят и который был страстным любителем игры в сквош (игра, в которую играют ракетками и мягким мячом в закрытых кортах). Однажды он услышал, как я рассказываю об обучении, и уходя заметил, что можно испробовать положительное подкрепление на его игре в сквош. Вместо того что бы как обычно сокрушаться об ошибках, он попробует вознаграждать себя за хорошие удары. Через две недели я снова встретила его. «Как сквош?» — спросила я. На его лице потаилось выражение заинтересованности и радости, что нечасто бывает с юристами с Уолл-стрит. «Сначала я чувствовал себя жутким дураком, — ответил он, — говоря: „Хорошо, Пит, молодец!“ при каждом удачном ударе. Черт возьми, когда я тренировался один, я даже поглаживал себя по спине. Но затем моя игра начала улучшаться. И сейчас я на четыре ранга выше в клубной лестнице, чем был когда-либо раньше. Я побеждаю тех, у которых прежде не мог выиграть даже очко. И получаю гораздо больше удовольствия. С тех пор как я не ору на себя все время, я не кончаю игру злым и разочарованным. Если удар не получился, ничего страшного, следующие будут хорошими. И я обнаруживаю, что мне просто смешно, когда кто-нибудь другой делает ошибку, бесится, бросает ракетку — я знаю, что это не улучшит его игру, я только улыбаюсь. Какой жестокий противник. И это сразу же как только перешел на положительное подкрепление». Подкрепление относительно, не абсолютно. Дождь является положительным подкреплением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не является положительным подкреплением, если вы сыты. Улыбки и похвалы могут быть непригодными в качестве подкрепления, если субъект хочет вывести вас из себя. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений.

Читайте также:  Аджилити для собак: кому, где, как?

В океанариумах «Жизнь моря» касаток подкрепляют множеством способов: рыбой (их пища), поглаживанием или почесыванием различных частей тела, вниманием окружающих, игрушками и т. д. Все представления — это действия, при которых животное никогда не знает, какое поведение будет подкреплено в следующий раз и каким будет подкрепление; эти «сюрпризы» так интересны для животных, что представления могут идти почти без стандартных подкреплений рыбой; животные получают пищу в конце дня. Необходимость постоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров. Положительное подкрепление приносит пользу и при взаимоотношениях между людьми. Оно лежит в основе искусства делать подарки: точно угадать, что будет иметь подкрепляющее действие (правильный выбор является подкреплением и для делающего подарок). У нас чаще всего принято доверять выбор подарков женщинам. Я даже знаю одну семью, в которой мать покупает рождественские подарки всем и ото всех. И очень забавно, когда рождественским утром братья и сестры говорят: «Смотрите, это Биллу от Энни», хотя все знают, что Энни тут ни при чем. Но это не совершенствует у детей навыка выбирать способы поощрения других. В нашем мире человек, выработавший в себе наблюдательность в отношении положительного подкрепления, имеет большие преимущества перед другими. Как мать, я сделала все, чтоб мои сыновья научились делать подарки. Например, однажды, когда они были еще маленькими — семь и пять лет, я повела их в довольно фешенебельный магазин и предложила каждому выбрать по платью для их младшей сестренки. Им понравилось, развалясь в плюшевых креслах, одобрять или не одобрять платья, которые она примеряла, как нравится какому-нибудь миллионеру помогать своей подружке выбирать норковую шубку. Их маленькая сестренка тоже получила удовольствие. Так, благодаря этому и подобным упражнениям, урок был усвоен: как по-настоящему проникнуться интересом к тому, что хочет другой человек, как находить радость в поисках положительного подкрепления для тех, кого любишь.

Положительные и отрицательные подкрепления собаки

Дрессировка собак основывается на взаимопонимании и взаимодействии дрессировщиков и их собак. Даже если мы не можем разговаривать с собаками таким же образом, как мы говорим с другими людьми, то, несомненно, может общаться с нашими хвостатыми компаньонами. Один из самых эффективных способов общения с собаками — способ положительною и отрицательною подкрепления.

Оба этих вида необходимы для нормирования поведения и обучения повиновению.

Положительное подкрепление необходимо для того, чтобы ваша собака поняла, какое именно ее поведение вам нравится. Желая и в дальнейшем получить положительное подкрепление, собака будет готова пожурить нужное поведение в будущем. Положительное подкрепление будет значимым (интересным, важным) для собаки, если оно удовлетворяет какую-нибудь из потребностей. Существуют две основные потребности собак, которыми можно пользоваться в дрессировке — потребность в социальном взаимодействии и пищевая потребность.

Потребность в социальном общении и взаимодействии жизненно важна для собак. Дикие собачьи родственники, например, волки, женятся, играют, лентяйничают и едят в окружении себе подобных — в своей стае. Наши домашние собаки, потомки волков, инстинктивно ищут свою стаю. Поэтому ваша собака рассматривает людей и других собак вашего дома именно в этой роли.

Дрессировщик может закреплять нужное поведение своей собаки при помощи трех очень эффективных “социальных наград” (трех видов положительного социального подкрепления) — ласка, игра и словесная похвала. Собаки любят касаться. Нежное поглаживание за ушами или энергичный массаж спины и поясницы очень нравится большинству собак. Получение такого воздействия после завершения упражнения повиновения будет рассматриваться собакой как положительное подкрепление (награда). Собака будет знать, что ее поведение понравилось вам. Но, кажется, собакам не нравится, когда ей стучат по голове, как по барабану. И еще, собака может иметь свои собственные, свойственные только ей, зоны тела, чувствительные к ласкам.

Игра — форма другого приятного социального взаимодействия. Большинство собак любит играть. Найдите объект, который ваша собака любит, например, игрушку-пищалку или мяч. Играйте со своей собакой после того, как она успешно завершает упражнение повиновения. Когда я обучал своего золотистого ретривера Вуди по курсу послушания А.К.С., я всегда носил теннисный мяч в кармане жакета. После двухминутного упражнения я играл с Вуди мячом минуты две — бросал мяч в траву, а Вуди его отыскивал. Вуди любил такие игры и скоро понял, что занятия в конце концов приводят к веселой игре.

Ваша собака также интерпретирует словесную (устную) похвалу (условное положительное подкрепление) как награду. Собак привлекают восторженные, высокие звуки. Унылое повторение: “Хорошая собака, хорошая собака” не будет эффективным как подкрепление. Будьте оживленней. Делайте похвалу интересной для собаки. Следите за ее хвостом — если он виляет, собака принимает похвалу. Имейте в виду разные собаки имеют разные уровни возбудимости. Некоторые из них могут радоваться слабой похвале, другим требуется более интенсивное воздействие. Вы должны отыскать свою устную похвалу, чтобы ваша собака была довольна во время дрессировки.

Пищевая потребность — другая основная потребность собаки. Пищевое подкрепление очень помогает в обучении. Инструктора по дрессировке имеют различные мнения относительно использования пищевого подкрепления как награды. Некоторые считают, что наличие пищи мешает концентрации внимания собаки на поведении во время обучения. Я не соглашусь с этим. Ведь мысль о пище не нарушает концентрацию внимания волка, когда он обучается охотиться на кроликов. Но, наоборот, усиливает ее.

Другие инструкторы по дрессировке считают, что, если пищевое подкрепление используется в обучении, собака будет подчиняться только тогда, когда будет голодна. Но я рекомендую использовать пищу как один из способов положительного подкрепления. Если пищевая подкормка используется правильно, такое положительное подкрепление не будет вызывать проблем при обучении.

Отрицательное подкрепление. Любовь, похвала и награда — очень важные аспекты успешного обучения собаки. Но, к сожалению, этого не достаточно. Отрицательное подкрепление также необходимо, если дрессировщик хочет преуспеть в общении со своей собакой, если он желает чтобы она его поняла до конца. Как я упоминал ранее, обучение должно строиться на мироощущении, мировоззрении собаки. Например, волк поддерживает порядок в своей стае при помощи демонстративного и физического взаимодействия. Однако волк не наказывает членов своей стаи. Точно также и я рекомендую, чтобы вы воздерживались от наказания своей собаки.

Между наказанием и отрицательным подкреплением существует большое различие. Наказание происходит после того, как индивидуум совершил нежелательный поступок. Отрицательное подкрепление происходит во время нежелательного поведения. В этом случае собаке легче связать неприятные воздействия с выполнением нежелательного поведения. Как мы знаем, наказание, как расплата за преступление, неизбежно. Отрицательное подкрепление же всегда связано во времени с поведением. Собаки не способны думать так: “Ага, меня наказывают сейчас за то, что я сделал двумя часами раньше!” Поэтому пользуйтесь отрицательным подкреплением, оно наиболее действенно в дрессировке и исправлении поведения.

Натуральное отрицательное подкрепление. Лидер стаи собак не пинает, не бьет кулаком и не убивает членов своей стаи, поведение которых ему не нравится. Я настоятельно рекомендую, чтобы вы также избегали этих оскорбительных методов. Взамен используйте вот такие виды натурального отрицательного подкрепления при обучении своей собаки.

Например, ваш голос — один из видов натурального воздействия, при помощи которого вы можете общаться с собакой и изменить ее поведение. Как известно, собаки рычат. Когда щенки слишком шалят, родительница может громко рычать. Она говорит своим рычанием: “Что вы Делаете, остановитесь немедленно!” Всякий раз, когда вам нужно остановить нежелательное поведение собаки, попробуйте сказать ей что-нибудь (короткое слов или буквосочетание) хрипло рычащим тоном. Произносите не столько громко, сколько глубоко.

Собаки также кусают друг друга. Вы, наверное, наблюдали, как собака защищает свою кость, когда ее пытается отнять другая собака. Сначала собака-хозяин рычит. Если это не помогает, в ход идут зубы.

Я помню, как остался у магазина ждать своего приятеля в обществе его щенка. Отроду ему было девять-десять недель, а папой его был, скорее всего, немецкий овчар. Я попытался поднять его на руки, но это было так, как будто я пытался поднять детеныша аллигатора! Щенок зарычал и тут же укусил меня, как дикий звереныш. Я зарычал в ответ, но напрасно, щенок продолжал жевать мое запястье. Тогда я слегка укусил его в области спинки носа. Он тявкнул и отпустил мою руку. Я повернул его морду к себе и посмотрел ему в глаза. Щенок тут же принялся отчаянно меня вылизывать, как будто я был его давно потерянный отец.

Увидев это, приятель был очень удивлен. Он сказал: “Что ты сделал с моей собакой? Я никогда не видел, чтобы он кого-нибудь целовал! Он кусает каждого, кто близко подходит к нему”.

“Он укусил меня, а я укусил его”, — ответил я. С изумленным лицом приятель переспросил: “Ты укусил мою собаку! Но прежде, чем я успел ему ответить, он добавил: “Вообще-то я сам собирался его искусать. Он совсем не слушается меня и тоже норовит укусить. Сегодняшним утром я пытался наказать его скрученной газетой, так он напал на газету!”

Ясно, что приятелю никогда, действительно, не исправить нежелательное поведение его щенка, которого, вероятно последний раз воспитывала мамаша. Я же разговаривал с собакой на понятном ей языке.

Если вы собираетесь попробовать эту методику, будьте внимательны, чтобы собака не укусила вас в лицо. Зажмите ей пасть рукой, прежде чем укусите ее. Никогда не кусайте малознакомую собаку. Я кусаю щенков моих учеников пока они не достигли пятимесячного возраста. Своих собственных взрослых собак я кусаю смело, потому что знаю, они меня не укусят. Подчиненные не кусают бесспорного лидера стаи. (Я знаю, это звучит очень самоуверенно, но это совершенно точно).

Другое натуральное отрицательное подкрепление — толчок в области загривка шеи собаки. Загривок область шеи перед плечами. Трепание загривка используется собаками для коррекции поведения щенков. Я также наблюдал, как взрослые собаки захватывают пастью загривок другой собаки при попытке утвердить превосходство. Если вы не склонны кусать свою собаку, вы можете воспользоваться именно этим видом отрицательного подкрепления. Оба вида отрицательного подкрепления понятны собакам — это их язык. Я настоятельно советую вам разговаривать со своей собакой на их языке, так она быстрее поймет вас.

Со временем вы должны будете обучать свою собаку, используя методы, которые не относятся к разряду естественных. Собаки, конечно, не используют ошейников и поводков. Они не брызгают в морду друг другу водой, чтобы обучить шумных членов стаи быть тихими по команде. Но если способ гуманен, почему бы им не воспользоваться?

Что такое гуманный способ? Любой способ или приспособление, которые причиняют боль, вызывает визг собаки, или очень пугают ее, недопустимы. Гуманными являются те способы, которые помогают обучить собаку чему-нибудь ненасильственным путем.

Своевременная похвала дает понять собаке, что предшествующее поведение должно быть повторено. Своевременное отрицательное подкрепление обучает собаку избегать предшествующего ему поведения в следующий раз.

Наказание негуманно или, по крайней мере, несправедливо. Негуманно ругать или лупить собаку, которая час назад съела вашу диванную подушку. Это — не так честно, как жестоко звучащее рычание, произведенное в тот момент, когда собака только что схватила ее. При использовании своевременного отрицательного подкрепления собака быстро и эффективно обучится избегать нежелательного поведения без особого труда.

Гуманная дрессировка не разрушает доверие, существующее между дрессировщиком и его собакой. С другой стороны, слишком сильное или “зверское” наказание может очень сильно напугать вашу собаку. И, хотя вы сможете при помощи этого быстро исправить нежелательное для вас поведение, вы рискуете потерять любовь и доверие своей собаки. Если это случится, у вас будет плохой компаньон, друг и защитник.

Не вызывайте панического страха использованием отрицательного подкрепления. Вы должны использовать только соответствующее вашей собаке отрицательное подкрепление. Оно должно быть достаточно сильным, чтобы остановить исполнение нежелательного поведения, но вызывать страха.

Принципы гуманной дрессировки достаточно просты для понимания. Однако я знаю, что “гуманность очень субъективный термин. Познакомьтесь вот с такой историей. Я жил со стандартным пуделем в течение двенадцати лет. Я получил Джосси, когда ей было приблизительно восемнадцать месяцев, из ветеринарной больницы, где работал. Ее принесли в больницу для усыпления, потому что владельцы устали от ее выходок. Джосси мочилась, испражнялась и грызла вещи всякий раз, когда оставалась дома одна. Она кусала имеющихся в доме в семье трех маленьких детей. Как только дверь открывалась, она убегала прочь и не подходила по команде. У нее имелся длинный список огрехов поведения. Но все было просто: Джосси не была обучена.

Я чувствовал, что Джосси была хорошей собакой, и думал, что при правильном подходе и соответствующем обучении ее можно было бы спасти. Владельцы собаки были взволнованны и довольны тем, что я избавил их собаку от смерти. После того, как я за воевал доверие собаки, Джосси была готова для обучения. В течение полутора лет я обучал собаку по курсу А.К.С. — собака-компаньон. Однажды я отрабатывал навык укладки. Собака довольно хорошо справлялась с этим упражнением, но еще не была готова к сдаче экзаменов. Проезжающая повозка отвлекла ее и она встала, я зарычал на нее. Джосси посмотрела на меня. Я хотел коснуться ее рукой, но собака отступила. Проходившая мимо женщина внезапно начала меня ругать. “Вас нужно арестовать, — сказала она. — Я обращусь в общество по охране животных. Вы не должны так обращаться с хрупким, нежным созданием”. Так она ругалась в течение десяти минут.

Я пробовал объяснить ей, что сохранил жизнь этой собаке, что ее хотели умертвить, потому что она не была обучена и поэтому меня нельзя назвать жестоким. Но мне не удалось оправдаться. Вот вам женская интерпретация “жестокой” и негуманной дрессировки.

Познакомьтесь с другой историей. Однажды, когда я работал в ветеринарной лечебнице, туда принесла свою маленькую собачку одна пожилая женщина. У песика были очень длинные когти на пальцах, которые приносили ему страдания. Когда я спросил ее, почему она вовремя не обрезала коготки или не принесла собаку раньше, она ответила: “Ему это не нравится и он не позволял нам даже приблизиться к лапкам!” Для того, чтобы произвести операцию, этой собаке пришлось дать наркоз и еще в течение двух недель лечить воспаление подушечек лап. В то время как гораздо гуманней было бы периодически подрезать когти собачке, но для этого она должна бы быть достаточно воспитанной.

Читайте также:  Ринговая дрессировка: что должна уметь собака

Так что подумайте над тем, что такое гуманность и дрессировка. Гоните прочь свою слепую чувствительность. Гуманная дрессировка, обеспечивающая повиновение и регулярное ветеринарное обследование, может быть, требуют дополнительных затрат времени, но они делают счастливой жизнь собаки и в конечном счете, жизнь ее владельцев.

Отрицательное подкрепление в дрессировке собак

В одном из своих прошлых постов я рассказывала о дрессировке собак с помощью подкрепления, и, в частности, о положительном подкреплении. Сегодня я продолжу эту тему и раскрою сущность так называемого «отрицательного подкрепления», которое я тоже использую при дрессировке собак.

Напомню, что подкреплением может быть любой мой сигнал, при условии, что собака «понимает» его значение, то есть то, какое ее поведение мне нравится или не нравится и «знает», как ей действовать впредь.

Что такое отрицательное подкрепление

Отрицательное подкрепление — это то, чего субъект, в нашем случае — собака, стремится избежать, или то, что ей не нравится или неприятно.

К примеру, наш ягдерьер Шварц очень не любит, когда ему дуют на нос. В такие моменты он всегда отворачивает морду.

Разновидности отрицательного подкрепления

Отрицательное подкрепление может быть разным, охватывая весь спектр неприятных ощущений: легкий сквозняк из открытой форточки, от которого собака уходит в более уютное место , окрик владельца и шлепок газетой, которым он «награждает» помочившегося в неположенном месте щенка, электрический «укол» электроуправляемого ошейника.

Самое распространенное отрицательное подкрепление, которое применяю лично я — это рывок поводка с одновременным окликом собаки по кличке. С помощью этого коррекционного воздействия я даю понять своей собаке информацию о том, каким ее поведением я недовольна, а подкрепляя следом «исправившуюся» собаку, я сообщаю ей, как следует себя вести в данной ситуации.

Пример использования отрицательного подкрепления

Поясню на примере. Допустим, я иду по улице и веду на поводке свою собаку.

У меня пес породы ягдтерьер, которая славится своими охотничьими талантами, а потому, за неимением другой дичи, он любит проявлять интерес к дворовым кошкам.

Когда я вижу, что мой пес начинает неотрывно следить за очередным котом, я окликаю его по кличке — «Шварц!», и одновременно с этим одергиваю его за поводок. Он получает отрицательный сигнал — рывок поводка и «понимает», что меня данный кот не интересует. В следующий после рывка поводком миг, когда пес отворачивается от кота, я даю ему кусочек корма в качестве положительного подкрепления.

Если собака на прогулке тянет поводок, надо делать те же самые действия:

  1. Как только поводок натянулся, одергиваем собаку и окликаем ее по кличке;
  2. В момент, когда собака прекращает тянуть поводок, мы произносим команду «Рядом» и тут же даем ей положительное подкрепление в виде корма.

Таким образом, мы «объясняем» собаке, как ей избежать рывка: не тяни поводок и ты получишь за это корм. В результате, после большого количества повторений, у собаки вырабатывается автоматизм — идти рядом и не тянуть поводок.

Разница между отрицательным подкреплением и наказанием

Отличие отрицательного подкрепления от наказания заключается в следующих основных моментах:

  1. Отрицательное подкрепление дается точно в момент совершения собакой нежелательных действий, которые мы хотим исправить, или сразу после них — когда она лает, скулит, скребет дверь клетки/вольера, тянет поводок и так далее;
  2. Собака «знает» как избежать воздействия отрицательного сигнала, изменив свое поведение — прекратив лаять, скулить, тянуть поводок и т.д.;
  3. То есть, отрицательное подкрепление – информативно (несет собаке информацию). Собака, «понимает» какие именно ее действия связаны с неприятными ощущениями и со временем перестает их повторять;
  4. «Наказание» — это «неприятность», которую ощущает собака, но не знает, как ее избежать в будущем;
  5. В абсолютном большинстве случаев, когда владельцы наказывают своих питомцев, а последние снова повторяют нежелательное поведение, собаки просто не понимают — за что их наказали.

К примеру, если щенок регулярно оставляет лужицы в квартире, то этому могут быть следующие причины:

  1. Щенок еще слишком мал, чтобы терпеть и не понимает, как надо проситься на улицу;
  2. Его кормят кашей, перегружая жидкостью его организм и давая дополнительную нагрузку на почки;
  3. Он слишком заласкан или перевозбужден играми с владельцем, апостоянно находящаяся в стрессовом состоянии собака не может долго терпеть;
  4. Владелец не успевает вовремя дать отрицательное подкрепление, то есть во время или сразу после того, как собака помочилась.

Совершенно другое дело, если вы застанете щенка за этим «занятием» и бросите в него в этот момент что-нибудь «шумное», например, пустую металлическую банку из-под колы (делать это надо неожиданно, не замахиваясь на собаку рукой, чтобы впредь она не пугалась этого жеста). В следующий раз щенок вспомнит, что случилось,когда он в последний раз справлял малую нужду в доме и станет «проситься» (побежит к выходной двери) или потерпит до выгула.

Вывод

Повторим основные положения.

Отрицательное подкрепление это:

  • Все то, чего собака стремится избежать (неприятно для нее);
  • То, что воздействует на собаку точно в момент совершения ею нежелательного поведения;
  • То, что прекращается сразу после того, как только собака прекратила нежелательное поведение;
  • Информативный сигнал, который собака понимает.

Надеюсь, что эта статья поможет вам разобраться с тем, что такое отрицательное подкрепление и как оно используется при дрессировке/обучении собак.

Если после прочтения статьи у вас остались или появились какие-либо вопросы, то задавайте их в комментариях, пишите нам в нашу группу Дрессировка собак ЛИРОС, в личные сообщения Вконтакте или на электронную почту ploskovliros@gmail.com.

Желаю вам успехов в дрессировке вашего питомца!

Метод положительного подкрепления при дрессировке собак.

Метод положительного подкрепления при дрессировке собак

Метод положительного подкрепления
Этот метод, может применять при дрессировке любых животных, но особенно он подходит для собак. Это система, целиком опирающаяся на побудительный мотив (стимул), и отвергающая физическое воздействие или силу в любых их проявлениях. Этим методом могут пользоваться даже дети. Он не требует какого-либо природного дара (таланта) дрессировщика. Он не связан с каким-то особым тоном, выбором подходящего времени, не основан на регулярной практике и не опирается на какую-либо из традиционных теорий дрессировки собак. Все, что требуется,- ваш разум и какой-нибудь лакомый кусочек.

Как научить собаку, чтобы она по команде ложилась в каком-нибудь определённом углу комнаты? Для этого существует два способа.

1. Можно бить собаку плёткой всякий раз, когда она пойдёт в какой-либо другой угол, и вообще бить до тех пор, пока она не усвоит, что указанное вами место – единственное безопасное убежище,

2. Можно дать собаке особенно вкусный кусочек в этом уголке и полностью её игнорировать, когда она пойдёт в какую-то другую часть комнаты. Что тут такого нового?”

Разумеется, это здравый смысл. Каждый владелец собаки ежедневно поступает подобным образом и дома, и вне его стен, не задумываясь о том, что и как он делает. Хотя почему-то, когда требуется сделать некоторое усилие и чему-нибудь научить свою собаку, мы становимся в позу дрессировщика и вспоминаем стародавний подход: “Ты собака, я хозяин. Я приказываю, ты подчиняешься”.

Когда дома вы подзываете собаку, вы обычно намерены покормить её, или взять на поводок и повести на прогулку, или показать, что вы уронили еду на пол в кухне и хотите, чтоб она всё подчистила. Действительно, дома мы редко зовем собаку просто так, обычно это происходит по какой-то причине, и в большинстве случаев выполнение команды сулит собаке что-то приятное. В результате, лишь немногие люди жалуются, что собака не идёт на зов дома.

А в ближайшем парке дело обстоит совсем иначе. Вы гуляете, она свободно бегает, играя с другими собаками, охотится за белками, роется в мусорных урнах, в то время как вы погрузились в собственные мысли. У ворот парка вы зовёте её, чтобы вести домой. И тут она, бросив на вас взгляд, направляется в противоположную сторону. (Такое все мы видим на улице чуть не каждый день.) В этот момент вы говорите себе: “Я должен, наконец, выдрессировать свою собаку”.

Вы её уже выдрессировали. Вы преуспели в том, что научили её не подходить к вам. Как? Очень просто. Собака быстро усвоила: если она не подойдет, то будет вознаграждена более длительной прогулкой. Если же она к вам подойдет, то лишится удовольствия: её отведут домой.

Если бы вы применили ваши “домашние приемы” дрессировки команды “Ко мне!”, подзывая пса около ворот, давая лакомство и затем, делая ещё круг по парку, то вскоре, услышав зов, он летел бы к вам пулей.

Хороший способ что то изменить- попробовать награждать собаку за хорошее поведение, вместо того чтобы думать, каким образом наказать её за нежелательное поведение.

Впрочем, на самом деле важно другое – при правильном применении положительное подкрепление весьма эффективно: оно изменяет нежелательное поведение.

Существует ряд основополагающих принципов, которые определяют успех применения положительного подкрепления как метода дрессировки. Но прежде чем начать применять эти принципы, или законы, с помощью специальных обучающих упражнений в процессе дрессировки собак, необходимо рассмотреть отдельно каждую стадию обучения, её цель и ожидаемый результат. Нас же интересует только то, как действует положительное подкрепление и как его применяют.
Как действует положительное подкрепление
Прежде всего, мы вообще должны забыть об упражнениях. Всё, что нас интересует для начала, – это первый шаг в нужном направлении.Мы хотим , чтобы собака подошла к нам.

Мы даём команду и ждём. Затем ждём ещё немного, а зачастую бывает, что ждём ещё и ещё.При подходе к вам собаки, даем лакомство и отпускаем.За второй подход к вам собаки-опять даем лакомство и отпускаем..Собака думает-“Ага”, как только я подойду, то получу лакомство.

Этот уровень понимания – уровень “ага!” – не может считаться закрепленным, до тех пор пока вы не добьётесь, чтобы происходило десять из десяти возможных немедленных реакций на команду. Пока это не достигнуто, не следует переходить к следующему этапу дрессировки. На первом её этапе кажется, что прогресс не очень заметен, однако для успеха обучения крайне важно, чтобы каждый этап заканчивался достижением уровня полного понимания. Если вы этого добьётесь, то обнаружите, что, по мере перехода к каждому следующему этапу, превращение первоначальной реакции в распознаваемую цепочку движений идёт очень быстро.

Теперь мы подходим к этапу дрессировки, который называется “формирование”. Нам нужно заменить уже сложившуюся цепочку: “команда – подход – обязательное лакомство”, новой цепочкой: “команда – подход собаки- лакомство дается иногда”. Достигается это следующим образом.

Формирование поведения означает, что мы делаем один маленький шаг в нужном направлении и продвигаемся к конечной цели, подкрепляя каждый сделанный шаг. Так мы обеспечиваем безусловное выполнение этой части цепочки, прежде чем двигаться дальше. Здесь наблюдается интересное явление: выполнение определённых действий, надежно затренированное с помощью вознаграждения, можно сделать ещё более чётким, если вознаграждение задерживать.

Предположим, затренирована такая реакция собаки: на десять подзывов она десять раз немедленно подбегате к вам. На одиннадцатый раз мы говорим: “Недостаточно хорошо, лакомство ты не получишь”.

Можно предположить, что теперь собака подумает: “Но я всегда получаю лакомство. Наверное, кто-то его стащил раньше меня. В следующий раз надо живее пошевеливаться”. И на двенадцатый раз вы получите более быструю и энергичную реакцию собаки: она подбежит к вам с большей скоростью. За это, безусловно, полагается лакомство, но теперь и в дальнейшем – только за это.

Дальше будем формировать цепочку: “команда -быстрый подход собаки- при немедленной реакции лакомство в награду в десяти случаях из десяти”. Лишь затем можно будет перейти к следующему этапу. Кажется, что обучаемый с каждым этапом всё скорее понимает, что от него требуется, и возникает эффект снежного кома.

Весь процесс обучения может осуществляться без какого-либо физического воздействия. Сначала мы ждём верного шага в нужном направлении и вознаграждаем его, затем закрепляем и придаем законченную форму.

в этом случае мы имеем пример положительного подкрепления нужного нам действия.

Подкрепление – это вознаграждение, получаемое за добровольное движение.

Всегда ли давать награду?

Прием действует лучше, если вы даете награду не всегда. Когда модель поведения сформирована, только самая быстрая, ярко выраженная и сильная реакция вознаграждается. Иногда ученику придётся выполнить отработанную цепочку шесть или семь раз, прежде чем последует вознаграждение.

Обязательно ли давать в награду что-то съедобное?

Наградой может быть что-то другое, ради чего, с точки зрения ученика, стоит выполнять определённые действия. Было бы бессмысленно пытаться сформировать поведение собаки с помощью тарелки капусты, если собака терпеть не может капусту!
Как применять положительное подкрепление
Пример научения собаки аппортировке, простейшим командам”Сидеть”,”Лежать”:

Собака по кличке “Йоко”-акита, Джон Фишер описывает этот процесс так:

“Я сидел за письменным столом в своей приемной, рядом на столе я поставил коробочку с лакомством. Протягивая собаке гантель, я говорил: “Возьми!” Йоко нюхала перекладину, а я говорил: “Хорошая девочка!” – и давал ей угощение.

Первое занятие продолжалось около пяти минут, и она получила вознаграждение сразу после быстрой реакции примерно в 60% случаев. В остальных случаях за правильные реакции иногда тоже давалось вознаграждение, но только после того, как собака нюхала стол, карабкалась на меня, лаяла или делала ещё что-нибудь, стараясь получить вознаграждение. На следующем занятии в тот же день удалось достичь уровня понимания (уровень “ага!”). Йоко тыкалась носом в гантель всякий раз, когда я давал команду.

На формирование действия и переход к следующей стадии потребовалось несколько больше времени. В течение четырех занятий по пять минут каждое она пробовала делать самые разные вещи, чтобы получить награду. Отношение было: 15%; 25%; 70%; 100%. Теперь я уже требовал, чтобы она не тыкалась в гантель носом, а лизала её. Не дав ей угощения, когда она в очередной раз лизнула гантель, я попал в точку, что вызвало эффект снежного кома гораздо раньше, чем я сам того ожидал. Она решительно выхватила гантель у меня из рук и смотрела на меня, как будто говоря: “Смотри, глупыш, я её взяла. Давай еду!”

Никто не может заранее определить модель формирования поведения при выполнении задания. Мы можем запланировать известную структурированную последовательность, но при обучении нам придётся руководствоваться темпом, который установит само животное. После того как вы вознаградили собаку за определённое движение, оно должно стать единственным движением, за которое дается награда, пока оно не будет затренировано. Йоко сделала больший шаг вперед, чем я ожидал, и, поскольку я её с энтузиазмом наградил, мне пришлось ждать, чтобы она его повторила. Это отняло меньше времени, чем я ожидал, но надо учесть, что Йоко очень прожорливая собака.

После такого огромного рывка вперед вся цепочка действий формировалась очень легко. Прошло совсем немного времени, и я уже бросал гантель на кушетку в дальнем конце приемной, а Йоко приносила её по команде, и садилась передо мной, держа её в зубах, гордая.

В первый же раз, когда на свежем воздухе я попробовал дать одно из тех упражнений, что предлагаются на состязаниях, она получила бы у меня за их выполнение все десять баллов из десяти. Но, кажется, я несколько пристрастен.

Возьмем теперь два простых действия: выполнение команд “Сидеть!” и “Лежать!”. Попытаемся, используя наш метод и не применяя силу, научить собаку чётко реагировать на данные команды.

Чтобы ускорить процесс, необходимо прибегнуть к подкупу. Иными словами, мы показываем награду, чтобы стимулировать движение. Как только достигается этот уровень понимания, мы обращаемся к команде, и подаем её только голосом, затем ждём, чтобы было сделано верное движение. Тогда мы придаём этому движению законченный вид.

Для отработки команды “Сидеть!” покажите собаке лакомство, даже дотроньтесь им до кончика её носа. Скажите: “Сидеть!” – и медленно переместите лакомство вверх и назад, чуть дальше линии глаз собаки. Сложение у собак такое, что если голова поднимается вверх и назад, то задняя часть туловища непременно опускается.

Для отработки команды “Лежать!” выберите такое препятствие, чтобы для его преодоления собаке нужно было лечь на брюхо. Это будет зависеть от размера собаки. Например, для немецкой овчарки подошёл бы кофейный столик. Подведите к нему собаку и предложите ей лакомство, держа его в руке под столиком, то есть под препятствием. Когда собака потянется за лакомством, медленно отодвигайте его под препятствием, побуждая собаку двигаться следом и командуя при этом: “Лежать!” В тот момент, когда её брюхо коснется пола, дайте вознаграждение.

Читайте также:  Вариативное подкрепление в дрессировке собак.

Теперь, когда мы научили свою собаку делать то, чего мы от неё добиваемся, остаётся отучить её делать то, что нам не нравится. Для достижения этой цели используем систему отрицательного подкрепления.”

по материалам книги “О чём думает ваша собакаДжона Фишера

Что такое положительное подкрепление в дрессировке собак?

Если вы только завели собаку или новичок в дрессировке собак — эта статья для вас. Она охватывает определение, практические вопросы, причины использовать положительное подкрепление и некоторые распространенные ошибки, которые совершают люди при его применении.

Положительное подкрепление — это весело, приятно, полезно и очень эффективно.

Что такое положительное подкрепление?

Положительное подкрепление — это очень эффективный способ дрессировки собак (и других животных).

Положительное подкрепление означает добавление чего-то сразу после того, как происходит поведение, что увеличивает частоту возникновения этого поведения.

Технически, этот термин состоит из двух частей. Подкрепление означает, что поведение продолжается или увеличивается его частота. (Если поведение угасает и не повторяется — это не подкрепление).

И положительное означает, что что-то добавлено.

Например, вы просите собаку сесть, собака садится, и вы даете ей лакомство (что-то добавлено). И в следующий раз, когда вы попросите, собака сядет с большей вероятностью (частота проявления поведения возрастает).

Что используется в качестве награды в положительном подкреплении?

Для дрессировки собак лучшая награда — это еда. Потому что все собаки любят есть, и это эффективно, потому что вы можете быстро ее дать.

Игра также иногда используется в качестве подкрепления в дрессировке. Например, игра в перетягивание или апортировка игрушек. Возможно, вы даже видели, как некоторых рабочих собак или собак-спортсменов в аджилити поощряют игрой в перетягивание.

Однако, на практике еда лучше всего подходит для большинства повседневных тренировочных ситуаций. Вы можете ее быстро достать (подумайте, сколько времени требуется для игры в перетягивание, по сравнению с тем, как быстро лакомство исчезнет в пасти собаки). Это означает, что вы можете делать несколько повторов за короткий промежуток времени. Кроме того, иногда игра может мешать учебному процессу.

Ласка и похвала также иногда предлагаются в качестве награды. Но вы должны думать об этом с точки зрения собаки — и да, ученые тоже подумали об этом. Одно исследование показало, что собаки могут быть не заинтересованы в похвале. Она всегда должна что-то значить для собаки. Например, если «молодец!» всегда сопровождается лакомством, тогда они узнают, что это предвещает удовольствие; но в противном случае, это может быть бессмысленно.

Большинство собак любят ласку, но те же ученые обнаружили, что собаки предпочитают еду ласкам при дрессировке. И если вам интересно, есть и другие исследования, которые сравнивали еду с ласками в качестве награды в дрессировке собак. Они также обнаружили, что еда приводит к лучшим результатам.

Проблема эффективности также актуальна: еда быстрее.

Таким образом, еда является лучшей наградой в качестве положительного подкрепления.

Какую еду мне нужно использовать в качестве подкрепления?

Существует огромное разнообразие вариантов, начиная от лакомств, которые вы можете купить в зоомагазине, до человеческой пищи, которая подходит для собак, и лакомств, которые вы можете сделать сами.

Выберете то, что действительно нравится вашей собаке, потому что это будет лучше мотивировать ее. Конечно, лакомство должно вписываться в общую сбалансированную диету. Вы также можете менять лакомства, чтобы обеспечить разнообразие или выбрать подходящее для конкретного задания.

Например, если вы много тренируетесь, маленькие кубики отварной курицы могут быть наиболее подходящим выбором, потому что это здоровый компонент диеты собаки. Или вы можете использовать крошечные лакомства, чтобы не перекармливать собаку (особенно это касается маленьких собак). В других случаях кусочки сыра или мясных деликатесов могут быть подходящим вариантом в умеренных количествах. Используйте самые вкусные награды для обучению сложным навыкам, например, подзыву.

Вот примеры еды, которые вы можете использовать для подкрепления: кусочки курицы, вареной говядины, кубики сыра, сушеные лакомства из субпродуктов и рыбы, морковь, арахисовое масло, тунец, покупные лакомства из зоомагазина, сосиски, колбаса (не жирная!), ветчина и т.д.

Некоторые из этих продуктов вызвали у вас обильное выделение слюны? Это хорошо, потому что этот тот эффект, которого вы хотите добиться у своей собаки! Конечно, вы не используете целую сосиску сразу. Лакомство должно быть размером с горошину. Попробуйте несколько вариантов лакомств, чтобы узнать, что предпочитает ваша собака.

В качестве награды также может использоваться паштет из тюбика. Вы можете купить готовые (например, leanlix или Lickety Stik) или сделать свой собственный с помощью пластиковых тюбиков.

Как известно, кошек нельзя кормить собачьей едой, однако собакам кошачий корм не навредит, к тому же многие собаки любят более соленые кусочки сухого кошачьего корма.

Если вы покупаете лакомство в зоомагазине — прочитайте список ингредиентов, чтобы удостовериться, что оно подойдет вашей собаке.

Убедитесь, что лакомство безопасно для собаки. Если вы используете человеческую еду для поощрения, обратите внимание, чтобы в составе не было лука (может содержаться в некоторых мясных и других продуктах) и ксилита (например, в некоторых марках арахисового масла), которые не безопасны для собак.

Если вы предпочитаете делать собственные лакомства, в интернете есть множество рецептов по их приготовлению. К тому же многие ингредиенты в них взаимозаменяемы.

Как использовать положительное подкрепление, если моя собака на специальной (лечебной) диете?

Если ваша собака находится на особой диете, вы все равно можете использовать лакомства в качестве награды. Один вариант — использовать консервированный корм той же линейки лечебных кормов, которой вы кормите собаку. (Если вы даете его с ложки, будьте осторожны, чтобы собака не травмировалась, научите ее слизывать лакомство или используйте тюбик).

Другим вариантом может быть использование одного из ингредиентов диеты (рыба или что-то еще). Вы также можете адаптировать рецепт домашних лакомств к тем ингредиентам, которые подходят для вашей собаки.

Что используют в качестве награды профессиональные тренеры?

Я спросила Кристи Бенсон, какую награду она использует при обучении собак. Кристи — тренер собак из Маниотбе, Канада и сотрудник Академии для собак.

Она сказала: «Мне нравится использовать еду, а виды продуктов, которые я предпочитаю, — это вещи, которые можно порезать на мелкие кусочки, и которые собаки могут быстро съесть, чтобы мы могли сразу продолжить тренировку. Мне также нравится использовать продукты, которые действительно нравится собакам, иногда это очень пахучие продукты, например, копченая рыба. Иногда я использую сыр. Иногда я покупаю полуфабрикаты (junk food), я знаю, что это не очень полезная еда, поэтому я использую ее не очень часто.

И также я использую некоторые рецепты лакомств, которые популярны у собачников, например, печенье из тунца или печени. У меня есть любимый рецепт лакомства из яиц, потому что у нас много яиц с местной фермы.»

И я напомню: «Я использую самое вкусное лакомство для тренировки подзыва у своих собак, потому что это проще. И рекомендую клиентам запасаться чем-то особенным (например, паштетом из тунца), чтобы лучше мотивировать собаку и предложить ей что-то действительно вкусное».

Что не является положительным подкреплением?

Иногда люди ошибаются, называя момент, когда что-то неприятное прекращается, положительным подкреплением. Это не так. Например, некоторые тренеры, использующие электрошоковый ошейник говорят, что когда удар током прекращается, это поощрение для собаки. Это не так.

Облегчение — это не то же самое, что награда!

Помните: положительное подкрепление означает, что что-то добавлено. Прекращение чего-либо противоположно добавлению чего-либо.

Стоит быть на чеку, потому что есть много запутанных слов про «бесконфликтную дрессировку» и другой ошибочной информации о дрессировке собак.

Поскольку нет регулирования деятельности тренеров собак, владельцы должны быть хорошо информированы.

Но моя собака не пищевик!

Это то, что каждому тренеру приходится выслушивать время от времени. Если это действительно так и ваша собака не заинтересована в еде, вам следует отвезти ее к ветеринару. Если ваша собака не ест, у нее может быть какая-то медицинская проблема, требующая обследования и лечения.

Чаще, когда люди говорят об этом, оказывается, что еда, которую они используют, не особо мотивирует собаку. Например, они предлагают ей гранулы сухого корма, которые она и так получает 2 раза в день — этого может быть недостаточно для мотивации собаки.

Это распространенная ошибка людей, которые новички в дрессировке. Если это относится к вам, проверьте список выше, чтобы найти там некоторые варианты лакомств. Скорее всего вам придется перепробовать несколько вариантов, чтобы узнать, какие больше нравятся вашей собаке, и помните, что разнообразие тоже может помочь.

Иногда люди неохотно используют еду для обучения собак, и именно поэтому используют сухой корм. Некоторые люди беспокоятся, что это может повлиять на их отношения с собакой — возможно, они боятся, что их собака на самом деле не любит их, если нужно использовать еду, чтобы она слушалась. Но ваша собака может любить и вас и еду, есть даже исследование фМРТ, доказывающее это.

А когда вы видите счастливый ожидающий взгляд вашей собаки, когда она хочет получить печенье, разве это не наполняет вас прекрасными теплыми чувствами?

Зачем использовать позитивное подкрепление в обучении собак?

Многие исследования показывают, что люди, которые используют методы обучения на основе положительного подкрепления, описывают своих собаках, как более послушных, чем те, кто применяет аверсивные методы. Использование положительного подкрепления улучшает контакт с собакой и лучше влияет на ее благополучие, чем использование отрицательного подкрепления. Корме того, предыдущий опыт обучения на положительном подкреплении, связан с лучшими успехами в обучении новому поведению.

Хотя эти исследования являются корреляционными и не доказывают причинности, есть несколько вещей, которые могут объяснить это. Во-первых, положительное подкрепление учит вашу собаку делать, а не просто наказывает за поведение (что совершенно не учит их новому поведению).

Другой момент, что наказание может являться стрессом для собаки, и если она свяжет владельца как причину наказания, это может негативно отразиться на отношениях с владельцем.

Есть еще одна причина использовать положительное подкрепление: собаки любят работать, чтобы зарабатывать награду. И теперь ученые рекомендуют, что для лучшего благополучия животных им необходим положительный опыт.

Поэтому использование положительного подкрепления в обучении полезно для вашей собаки.

Почему положительное подкрепление не работает?

Если вы думаете: «Я попробовал положительное подкрепление, и это не сработало!», то для этого есть несколько возможных причин.

Возможно, наиболее распространенной причиной является использование неподходящей награды, чтобы мотивировать собаку. Вернитесь к списку лакомств, и подберите что-нибудь повкуснее.

Но есть и ряд других возможных причин.

Возможно, вы не планируете занятия. Вы получите лучшие результаты, если будете составлять план занятий и следовать ему.

Возможно, вы недостаточно быстро даете лакомство. Например, вы просите собаку лечь, но к тому моменту, когда вы достанете лакомство, она уже вскочила, так что вы вознаградили неправильное поведение. Вам нужно научиться давать награду, как можно быстрее вслед за нужным поведением.

Может быть, наоборот, зная, что вам нужно как можно быстрее вознаградить собаку, вы на самом деле перемещаете свою руку к сумке с лакомством прежде, чем собака выполнит команду. Это может ее запутать. Собака реагирует на движение вашей руки как на подсказку.

Или, может быть, вы дали собаке слишком сложное задание. Очень часто кажется, что собака уже научилась нужному поведению после нескольких повторов. Это как если бы вы учились танцевать вальс, разучивая движения, но несколько удачных попыток недостаточно, чтобы научиться вальсировать; это требует больше практики. Ваша собака точно также нуждается в большей практике.

И, говоря о практике, вы также должны очень медленно вводить отвлекающие стимулы. Просто потому, что ваша собака умеет выполнять команду сидеть в комнате, когда ничего интересного вокруг не происходит, не означает, что она сможет так же выполнить ее в парке, когда рядом бегают другие собаки или дети, или даже белка. Это очень сложно!

Это все, над чем вы можете работать, но дрессировка собак — это сложное мастерство, и вам нечего стыдиться, если у вас не получается. Вам может потребоваться обратиться за помощью к квалифицированному тренеру собак или записаться в группу дрессировки. Поскольку дрессировка собак не регулируется, убедитесь, что тренер, к которому вы хотите обратиться, не использует аверсивные методы, а работает на положительном подкреплении.

Также вы можете воспользоваться списком литературы и интернет-ресурсов, которые я рекомендую.

Но тренер говорит, что это не применимо к моей собаке?!

Некоторые дрессировщики утверждают, что «положительное подкрепление не работает» или «это не сработает для вашей собаки» в качестве попытки оправдать использование ЭШО, строгого ошейника или удавки (контроллера).

Прежде всего помните, что дрессировка собак не регулируется. Некоторые тренеры просто не умеют работать иными способами, и поэтому считают неэффективным положительное подкрепление. Кроме того, старая традиционная школа дрессировки, представители которой все еще часто встречаются среди тренеров, считает, что собаки не способны к самоконтролю и пониманию того, что от них требуется, иначе, кроме как с помощью рывков и давления.

Во-вторых, важно знать, что существуют риски при использовании электрошоковых ошейников. Одно исследование в Великобритании показало, что ЭШО не более эффективны, чем положительное подкрепление для обучения собак подзыву. Они также обнаружили негативные последствия для благополучия некоторых собак.

Позаботьтесь о своей собаке и не позволяйте тренеру использовать методы дрессировки, которые вам не нравятся.

Нужно ли использовать кликер?

Кликер используют, чтобы отметить момент, когда собака совершает правильное поведение. Это очень быстро, поэтому он дает вам возможно отсрочить момент дачи собаке лакомства (не в ту же секунду, а несколько секунд спустя).

Некоторым людям очень нравится пользоваться кликером. Они также считают, что это помогает улучшить их технику (возможно потому, что они уделяют пристальное внимание тому, когда нужно щелкнуть, и не двигаются до этого).

Для поведения, которое очень быстрое и мимолетное, маркер (клик или ваш голос) действительно поможет. Но для многих других команд, которым мы обучаем собаку, например, сидеть или лежать, вполне можно обойтись только лакомством.

Самое главное — это использовать пищевое подкрепление для обучения вашей собаки. Если вы попробуете кликер, возможно, вам понравится им пользоваться. Но если вам он не подойдет, не беспокойтесь об этом. Просто продолжайте использовать лакомство.

Должен ли я всегда использовать положительное подкрепление?

Это частый вопрос, и на него легко ответить другим вопросом: хотите ли вы, чтобы ваша собака продолжала это поведение? Если ответ «да», то вам следует продолжать вознаграждать его.

Теперь вы можете вознаграждать не каждый раз. Использование прерывистого графика подкрепления (когда поведение иногда вознаграждается, а иногда нет) может помочь повысить устойчивость поведения к угасанию (именно тогда поведение может прекратиться). Это полезно, потому что в реальной жизни может возникнуть ситуация, когда вы забудете взять с собой лакомство.

Но это очень распространенная ошибка, когда человек полностью прекращает поощрять поведение. Конечным результатом является то, что собака перестает выполнять команду, и люди говорят: «Я пробовал, и это не сработало». На самом деле, это называется угасание: т.е. вы отучили собаку делать что-то, потому что перестали поощрять это поведение.

Другая очень распространенная ошибка заключается в том, что вы недостаточно поощряете поведение.

Помните, что собак любят работать за еду, и вам все равно следует кормить собаку. Тренировка с получением лакомства — хороший способ тренировать мозг вашей собаки и обеспечить обогащение среды. Вместо того, чтобы прекращать поощрять, лучше продолжайте думать о новых вещах, которым вы можете обучить свою собаку.

Положительное подкрепление в дрессировке других животных

С помощью положительного подкрепления можно дрессировать кошек, крыс, куриц и даже рыбок и крабов! Именно на положительном подкреплении обучают животных в зоопарках для того, чтобы приучить их к медицинским процедурам или передвижению в нужном направлении (в другой вольер).

Заключение

Надеюсь, эта статья предоставила вам полезную информацию об использовании положительного подкрепления в обучении собак. Если вам понравилось, поделитесь ей с друзьями.

Какое лакомство ваша собака считает самым вкусным?

Ссылка на основную публикацию