Вариативное подкрепление в дрессировке собак.

Вариативное подкрепление в дрессировке собак.

Не рычите на собаку!

Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; какулучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же, как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное или чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запугиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо.

Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубости. Зная лучшие способы управления поведением, мы достигли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем привести в соответствие те приемы, которыми современные дрессировщики достигают успеха, с законами положительного подкрепления. Какой бы ни была наша задача — заставить ли четырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортивную команду, выучить ли стихотворение — она решается быстрее, легче, веселее, если вы знаете, как пользоваться положительным подкреплением. Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обучение с подкреплением подобно игре, в которой надо быстро соображать. Каждый может быть тренером, но некоторые от природы способны к этому больше, чем другие. Вам вовсе не обязательно отличаться каким-то особым терпением, быть сильной личностью, не требуется и особого подхода к детям и животным, можно не обладать и тем, что цирковой дрессировщик Франк Бук называет силой человеческого взгляда. Вам надо только знать, что вы делаете. Всегда были люди с интуитивным пониманием того, как применять законы дрессировки.

Мы называем их талантливыми учителями, блестящими военачальниками, выдающимися тренерами, гениальными дрессировщиками. Мне приходилось наблюдать за некоторыми театральными режиссерами и многими дирижерами симфонических оркестров, которые очень умело использовали в своей работе подкрепление. Эти одаренные воспитатели не нуждаются в книге о том, как использовать законы, управляющие обучением. Однако для всех нас остальных — простых смертных, — кто вслепую пытается совладать с плохо управляемым питомцем, вступает в конфликт с ребенком или сослуживцем, знание законов подкрепления может сослужить хорошую службу. Обучение с подкреплением — это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление — будь то «положительное», то, к чему надо стремиться, например, улыбка или ласка, или «отрицательное» — то, чего надо избегать, подобно рывку поводка или нахмуренным бровям — происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент.

Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария «Жизнь моря». Раньше я дрессировала собак и лошадей, пользуясь традиционными методами, но дельфины — другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление — в основном ведро с рыбой — единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при работе с дельфинами. Имея биологическое образование и всю жизнь интересуясь поведением животных, я оказалась очарованной не столько дельфинами, сколько моим с ними взаимным общением во время дрессировки. То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его — это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье.

Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно, правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении.

Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т. д.; это тот раздел психологии, который принес мировую известность Б.Ф. Скиннеру, профессору Гарвардского университета.

Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит в ярость тех, кто является поборником «свободной воли» в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку средствами.

Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни — например, аутизм — оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скрупулезным копанием в источниках его происхождения — по крайней мере в некоторых обстоятельствах — способствовала возникновению семейной терапии, в которой рассматривается поведение каждого члена семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные учебники, разработанные на основе Скиннеровской теории, были первыми попытками разбить обучение на этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффективным, благодаря совершенству выбора времени подкрепления компьютером, но и висело в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Интересным применением подкрепления для тренировки физиологических реакций является биологическая обратная связь.

11 правил в дрессировке собак

Хотите понимания и послушания от вашей собаки? Хотите уважения и следования за вами? – Представляем вашему вниманию основные правила в дрессировке собак, соблюдая которые вам будет проще воспитать послушную собаку, которая вам доверяет, что обеспечит вам комфортное совместное проживание на долгие годы.

11 правил в дрессировке собак

1. Постоянство

2. Настойчивость (упорство)

3. Не требуйте от собаки того, чему не учили

4. Быть понятным собаке

5. Не обманывайте

Например, вам необходимо сделать собаке укол, которого она боится. Собака забивается под диван, а вы пытаетесь ее оттуда выманить. Она любит гулять и знает это слово. Вы пользуетесь этим и говорите: “Идем гулять”, хотя на самом деле не собираетесь этого делать. Собака радостно выбегает к вам, виляя хвостиком, – тут-то вы ее и хватаете. Тем самым вы обманули собаку и подорвали ее доверие. Теперь ваша собака сначала 100 раз подумает, прежде чем выполнить ваши требования, следовательно, контакт и доверие между вами нарушены.

6. Ошибка собаки указывает на ваши ошибки

Если собака выполняет какое-либо действие неправильно, значит вы неправильно ее этому научили. То есть, все дело в четкости ваших действий, в своевременности подкрепления, т.е. в поощрении именно того действия, которое вы хотите, чтобы ваша собака повторяла в дальнейшем.

7. Удовлетворите потребности

Если собака испытывает дискомфорт, если у нее что-то болит, если она находится в стрессе, если ей не хватает физической и интеллектуальной нагрузки, если вы не удовлетворяете ее видотипичные потребности – обучаемость падает. Прежде чем чему-то обучать или ожидать послушания следует удовлетворить основные потребности животного. Ведь когда нам плохо и не комфортно – мы плохо усваиваем знания, а, например, в страхе, вообще не сможем ничему научиться – также и собака.

8. Уверенность

ПравилоПример
Вы хотите, чтобы собака не попрошайничала. ОБЫЧНО вы не даете собаке кусочки со стола, но ИНОГДА можете себе это позволить. Результат – собака будет терпеливо ждать того долгожданного момента, когда вы наконец дадите ей заветный кусочек. Тем самым вы даете ей надежду, а ждать они умеют! В дрессировке это называется вариативным подкреплением, которое характеризуется тем, что награда выдается не каждый раз, а в случайном порядке. Вариативное подкрепление гораздо эффективнее постоянного. Причем чем больше интервалы между подкреплениями в вариативном режиме, тем сильнее он стимулирует поведение. Следовательно, если вы хотите, чтобы собака чего-то НЕ делала, то НЕ позволяйте ей этого НИКОГДА, придерживайтесь постоянства в своих требованиях.
Если вы дали собаке какую-либо команду – обязательно добейтесь ее выполнения. После выполнения не забудьте поощрить собаку похвалой и лакомством.
Если при дрессировке собаки вы не следите за четкостью и правильностью выполнения действия, то и не требуйте в дальнейшем от собаки нормативного выполнения команды. Например, при обучении команде “Сидеть” вы допускали неровную посадку, собака заваливалась на сторону. Потом вы вдруг решила, что так неправильно и стали требовать от собаки правильной ровной посадки, но собака уже была научена, что неважно как сидеть, главное сидеть, – ведь ей вообще все равно, как именно сидеть. Это ваше допущение. Собаку просто придется немного подкорректировать, показать, что вы от нее хотите, либо оставить как есть, если вам это не мешает.
Ваши действия должны быть понятны собаке, целесообразны для нее, последовательны и предсказуемы. Также важна четкость в ваших действиях и движениях. И, конечно, знание языка телодвижений собак и сигналов примирения.
Вы должны быть спокойны, уверенны в себе, решительны, без суеты уметь принять верное решение. И если все это вы транслируете собаке – она почувствует в вас мудрого учителя и пойдет за вами.
9. От простого к сложномуРазбивайте каждый навык на много-много этапов и маленькие шажочки. Идите от простого к сложному постепенно. Переходите на следующий этап только после закрепления предыдущего. Если что-то перестало получаться – вернитесь на шаг назад.
10. Поощряется = закрепляетсяСледите за тем, что поощряете. Если собака делает то, что вам не нравится, – игнорируйте. Но когда она делает то, что вам хочется, – щедро поощряйте. То, что вы не подкрепляете, – угасает со временем. То, что подкрепляете, – закрепляется и повторяется.
11. Собака – живое существоВы считаете, что ваша собака идеально выдрессирована. Она отлично работает у вас при отвлекающих факторах, выполняет команды беспрекословно. Идя с ней вдоль шоссе вы не берете ее на поводок, так как она идеально ходит рядом. НО – собака – живое существо! Подумайте о том, что на другой стороне дороги ей может что-то показаться, например, знакомый человек. Или она увидит знакомую собаку, с которой любит играть, или кошку, а может течную суку – вариантов много! При самом идеальном послушании один раз она может сорваться с команды и, это может стоить ей жизни.

Соблюдение этих простых правил в дрессировке собак поможет вам при обучении питомца для достижения контакта, доверия и взаимопонимания. Если же у вас возникли проблемы, вы не понимаете своего любимца, а он не понимает вас – школа воспитания семейных собак “Джильда” поможет вам во всем разобраться, обращайтесь: контакты >>

Вариативный режим подкрепления в дрессировке собак

Обучая собаку какому либо новому навыку, со временем мы начинаем задаваться вопросом — когда следует прекращать дачу подкрепления?

В нашей методике Лидерско-Ролевого Обучения Собак, мы продолжаем подкреплять действие до ее отказа от корма и желания выполнять сформированные задачи без него, то есть пока новое поведение не станет у собаки привычкой и, образно выражаясь, «мировоззренческой позицией». На это уходит в среднем 6 месяцев ежедневной дрессировки и около 5 тысяч раз повторений. Именно такое количество времени требуется на создание автоматизма (привычки). Это справедливо как в отношении собак, так и людей.

То, что собака начинает отказываться от корма является свидетельством завершения обучения. И после того как навык создан, мы прекращаем подкреплять каждое действие собаки и переходим к вариативному режиму подкрепления.

Что такое вариативный режим подкрепления

Вариативный режим положительного подкрепления — это эпизодическое (случайное, непредсказуемое) подкрепление собаки.

При постоянном подкреплении индивид знает, что будет получать подкрепление каждый раз, вне зависимости от качества выполняемых действий.

Режим вариативного подкрепления не дает возможности индивиду предугадать, какое из действий будет подкреплено, следовательно, он старается выполнить хорошо каждое из них.

Вариативное подкрепление очень распространено в жизни людей. К примеру, оно лежит в основе так называемых азартных игр. Людям нравится невозможность предсказать — когда они ничего не получат, когда выиграют пару монет, а когда много денег.

Таким образом, режим вариативного подкрепления отлично помогает поддерживать выученное поведение, как у собак, так и у людей. И чем длительнее интервалы между подкреплениями, тем больше возможностей у дрессировщика улучшить поведение (исполнительское мастерство) у ученика, поскольку у первого появляется возможность подкреплять у второго наилучшее исполнение.

Однако,иногда режим с длительными промежутками между подкреплениями работает против нас, если мы хотим устранить какое-либо поведение- избавиться от плохой привычки, отучить от плохой привычки своего питомца. Например, привычки прыгать на владельца, когда тот приходит домой.

В данной ситуации необходимо перестать обращать внимание на собаку, лишить ее возможности быть лидером отношений и манипулировать вами. Чтобы достичь этого можно, например, вести себя так, словно ее не существует. Войдя в дом, надо не обращая на нее внимания, спокойно разуться, раздеться, пойти выпить чашку чая. И только потом, дождавшись момента, когда собака успокоится, подозвать и погладить собаку (если вы без этого не можете обойтись).

Если целенаправленно и неотступно следовать этому правилу, то со временем собака перестанет прыгать на владельца, когда он возвращается домой.

Но, если вы будете иногда делать исключения из правила, то есть реагировать на «радующуюся» вашему приходу собаку, окликать ее по имени, гладить и т.д., то это поведение не только не исчезнет но, более того — оно значительно укрепится.

Поэтому, каждому владельцу необходимо строго придерживаться выбранного стиля поведения до тех пор, пока у собаки не исчезнет та «вредная» привычка, которую вы решили у нее убрать.

Когда нельзя использовать вариативное поведение

Вариативное подкрепление ни в коем случае нельзя применять в начале обучения (формирования у собаки нового поведения), обязательно подкрепляя каждое выполненное ею правильное действие (постоянный режим подкрепления).

Выводы

Кратко подведу итог:

  1. Разучиваемый навык необходимо подкреплять в режиме постоянного подкрепления вплоть до создания у обучаемого привычки (6 месяцев дрессировки и пять тысяч раз повторений);
  2. После того как новая привычка у собаки создана, нужно переходить на вариативный — то есть случайный режим подкрепления с длительными интервалами, подкрепляя у ученика наилучшее исполнение приема (вариабельный режим подкрепления);
  3. Вариабельный режим подкрепления нельзя использовать при попытке устранить у ученика нежелательное поведение (вредную привычку).

Примечание

Все описанное выше закономерно только для особей сбалансированного психотипа, то есть для так называемых «нормальных» собак. При работе с агрессивными или трусливыми собаками, сначала необходимо с нуля создать новые взаимоотношения, основанные на иерархии или, проще говоря — суррогатную стаю, в которой владелец — Старший (лидер), а собака — Младший (подчиненный).

Пять основных ошибок при дрессировке собак на положительном подкреплении.

Вы никогда не услышите от меня, что принудительные методы дрессировки собак не работают, они работают. Так же вы не услышите от меня, что поощрительные методы сделают из любой собаки образцовую собаку-компаньона. Нет, это не так.

Однако существует большая разница между поощрительным и принудительным методом воспитания. В случае если метод, опирающийся на применение силы, не приносит результата, то, скорее всего, это связано с тем, что собака не способна терпеть физическое давление и устрашение. Это может привести к долгосрочным серьезным проблемам в поведении животного и иногда к физическим повреждениям у собаки.

Собаки с более напористым характером могут настойчиво сопротивляться принудительным методам дрессировки. В то время как те, чей характер мягче, чтобы вытерпеть физические наказания, могут укусить из оборонительных целей или просто полностью закрыться. Поощрительный метод дрессировки часто оказывается неудачным из-за ошибок, возникающих при его реализации. Если вы неправильно пользуетесь кликером и поощрениями, то в результате вы можете получить толстую, счастливую и неконтролируемую собаку, но у вас гораздо меньше шансов нанести ей психический и физиологический ущерб.

Целью, конечно, остаётся здоровая, счастливая и послушная собака. Для того чтобы добиться такого результата поощрительными методами дрессировки, вы стоит избегать типичных ошибок, описанных ниже.

Ошибка №1. Путать положительное подкрепление и вседозволенность

Скорее всего, вы слышали, что тренера, использующие отрицательное подкрепление, настаивают на том, что должны быть негативные последствия за неприемлемое поведение, а иначе животное никогда не поймёт, что ему дозволено. Вы удивитесь, когда узнаете, что сторонники положительного подкрепления не спорят с этим. Дело в том, что мы по-разному понимаем последствия этого. Хорошо реализованная программа поощрительной дрессировки совмещает правильный менеджмент ситуаций — чтобы не дать собаке возможность получить подкрепление нежелательного поведения и негативное наказание – когда неприемлемое поведение собаки приводит к прекращению каких-то хороших вещей.

Посмотрите эти примеры:

Принудительный/силовой — собака на поводке, собирается прыгнуть на прохожего. Хендлер жёстко корректирует (наказывает) ее, резко дернув за поводок. Прыжок наказывается. Собака запоминает, что происходит что-то плохое, когда она пытается на кого-то прыгнуть. Стоит отметить, что собака может так же запомнить, что сам факт приближения к человеку может вызывать негативные последствия, что ведёт к формированию агрессивного или боязливого поведения в присутствии незнакомцев.

Позитивный — собака на поводке, собирается прыгнуть на прохожего. Хендлер удерживает собаку так, что она не имеет возможности приблизиться к человеку. Просит прохожего остановиться и подождать, пока собака сядет и уже потом разрешает ее погладить. Действие собаки было проконтролировано, собака запоминает, что от прыжка на прохожего она ничего не получает, а вот если она сядет рядом с человеком, то это приведет к хорошим последствия. Так закладываются основы для будущих хороших манер и умения вежливо знакомиться с посторонними.

Вседозволенный – собака на поводке, собирается прыгнуть на прохожего. Хендлер позволяет собаке исполнить её желание, и прохожий награждает её поглаживанием. Поведение подкрепляется. Собака запоминает, что прыжки приносят приятные эмоции и продолжает прыгать на гостей, приходящих в дом, иногда даже усиливая свои попытки прыгнуть на человека.

Менеджмент ситуаций играет жизненно важную роль в положительном (а не вседозволенном!) методе дрессировки. Не давая собаке получить награду за нежелательное поведение, вы не даете собаке самоподкрепляться в этих ситуациях. Это работает, когда вы пресекаете прыжки собаки на прохожих, закрываете её в клетке, чтобы не дать ей разгромить дом в ваше отсутствие, убираете всё съедобное со стола, чтобы собака не училась проверять поверхности на предмет вкусных «подарочков», убираете привлекательные предметы из зоны доступа, чтобы собака не могла их сгрызть и много других вариантов, где вы можете использовать менеджмент ситуаций.

Поведение, которое никак не подкрепляется, в конечном итоге исчезает. Особенно, если вы делаете упор на поощрении альтернативного, желательно несовместимого с первым, поведения.

Ошибка №2 Зависимость от наведения

Если вы не убежденный приверженец шейпинга (метод обучения через отбор поведения), то вы, скорее всего, используете наведение при работе с положительным подкреплением.

В наведение используются лакомства, чтобы показать собаке, что вы хотите, чтобы она сделала. Чтобы навести собаку на команду «лежать», держите лакомство прямо перед носом собаки, пока она сидит, затем начните потихоньку опускать его вниз. Как только собачий нос потянется за лакомым кусочком, обозначьте это действие щелчком с помощью кликера либо голосом, например «да», и наградите лакомством.

Продолжайте постепенно опускать лакомство на пол, хвалить и поглаживать собаку, пока она лежит на полу. Если вдруг собака встанет, скажите «нет», усадите собаку и начните наводить заново, но на этот раз опускайте лакомство не так быстро.

Наведение для обучения новому поведению – это хорошо. А вот забывать постепенно убирать наведение – это нехорошо. Если вы не начнете достаточно быстро убирать наведение во время обучения навыку, поведение вашей собаки может стать зависимым от наличия лакомства в вашей руке. Несмотря на то, что у меня почти всегда есть лакомство в кармане или где-то поблизости, я не хочу, чтобы моя собака показывала нужный навык, основываясь только на знании, что лакомство у меня с собой.

Здесь описано как постепенно отойти от наведения на примере команды «лежать»:

  1. Применяйте наведение до тех пор, пока собака не станет выполнять команду без особого труда — когда вы опускаете корм вниз, собака ложиться сразу и получает лакомство. Для большинства собак шести повторений бывает достаточно.
  2. Встаньте перед собакой, держите руки по бокам от себя. Лакомство держите в руке, которую вы используете для наведения. Если собака пытается достать лакомство из руки, спрячьте её за спину.
  3. Как только собака сядет, дайте команду «лежать».
  4. Подождите немного, и, если собака не ляжет (что происходит в большинстве случаев), наведите собаку лакомством в нужное положение.
  5. Повторите 3 и 4 шаги несколько раз. Иногда ждите чуть-чуть дольше, прежде чем начать наводить, иногда начинайте раньше.
  6. Если собака не ложится после шести повторений, начните постепенно убирать наведение. Скомандуйте «лежать», пауза, начните наводить собаку, но вместо полного движения рукой до пола, проведите ¾ пути и быстро спрячьте руку за спину, ведя ее параллельно полу (если вы поднимете руку, то собака, скорее всего, снова сядет). Поскольку собака проделала ¾ пути до пола, то вероятнее всего, она продолжит движение и ляжет, несмотря на то, что лакомства уже нет. Если собака всё же встала, то попробуйте проделать то же самое, но провести куском 7/8 пути до пола.
  7. Повторяйте шаг 6, постепенно уменьшая наведение к полу, пока оно совсем не исчезнет.

Вы можете применить этот алгоритм к любым другим командам, которые можно научить наведением. Как только собака начнёт быстро выполнять их с наведением, сразу же начинайте наведение уменьшать. По сути, вы переводчик для вашей собаки, вы показываете ей, что слова, которые вы используете – это эквивалент наведению. Когда вы даёте команду «лежать», делаете паузу и затем наводите, это равнозначно тому, как если бы вы сказали: «Собака, слово «лежать» значит то же, что и кусок перед твоим носом, который опускается на пол, а ты следуешь за ним».

Ошибка №3 Зависимость от поощрения

Даже если у вас хорошо получается уходить от наведения, вы все равно можете замечать за собой, что не можете отказаться от постоянной выдачи лакомства – вам кажется, что вы обязаны поощрять собаку каждый раз, когда собака демонстрирует нужное поведение, а иначе оно может угаснуть.

Такая ситуация называется непрерывное подкрепление. Собака может достигнуть таким способом великолепного стабильного поведения, но это поведение скорее всего не будет достаточно длительным . Если по каким-то причинам вы перестанете поощрять каждый раз, когда собака демонстрирует поведение, скорее всего собака достаточно быстро перестанет показывать нужное поведение, поскольку она перестает получать первичное подкрепление (еду).

Примените очень важный концепт вариативного подкрепления. Когда ваша собака стабильно выполняет команды на непрерывном подкреплении – демонстрирует желаемое поведение как минимум в 8 из 10 случаев, то пора начинать поощрять с перерывами. Проще говоря, время от времени пропускайте момент клика и лакомства, вместо этого хвалите собаку. По началу, пропускайте щелчки лишь изредка, постепенно начиная пропускать всё больше и больше, до тех пор, пока собака не начнет работать в основном за похвалу (или другие социальные поощрения).

Если вы постоянно включаете похвалу в ваш дрессировочный процесс — клик, лакомство, «хорошая собака!», тогда у вашей собаки выработаются позитивные ассоциации с похвалой, и она будет ценна для собаки, даже когда вы станете работать без кликов и лакомства.

Напоминаю: в моих дрессировочных сессиях, кликер всегда значит, что потом последует лакомство. Когда я начинаю внедрять вариативное подкрепление, то я перестаю кликать, а только хвалю. Это помогает сохранить ценность и силу кликера.

Вы можете использовать другие поощрения, когда хотите поощрить животное без кликера и лакомства. Все, что ваша собака любит, может использоваться для мотивации, особенно если вы можете контролировать доступ собаки к предмету и применять его в поощрении правильного поведения. Это могут быть: мячик, любимая игрушка, прогулка на машине, на поводке или почесывание за ухом.

Иногда, я поощряю своих собак за ожидание перед дверью, открывая дверь и разрешая им выбежать из нее. Они срываются с места и бегут играть и делать свои дела. Все это тоже варианты социальных поощрений, которые подкрепляют собак естественным путём.

Конечно, они не всегда получают возможность выскочить в дверь. Вариативное поощрение делает поведение очень длительным. Как игроман с автоматами, ваша собака будет играть бесконечно, потому что она знает, что однажды получит награду.

Ошибка №4 Несвоевременность

Некоторые дрессировщики скажут вам, что последствия должны последовать за действием в течение какого-то определенного промежутка времени, чтобы они повлияли на действие, т.е. чтобы собака поняла связь между поступком и наградой (наказанием). Я слышала, что кто-то называет цифру в 5 секунд (на мой взгляд, это слишком долго), кто-то говорит про 1 секунду (по-моему, это более верная цифра).

Достаточно сказать, что результат тем лучше, чем ближе последствия к самому действию по времени. Это одинаково верно и для положительного подкрепления (лакомство, похвала, игрушка, поглаживание) и для негативного наказания (когда поведение собаки приводит к тому, что хорошие вещи уходят) или для положительного наказания (когда поведение собаки приводит к тому, что плохие вещи начинаются). Конечно, тренеры работающие на положительном подкреплении стараются избегать использования положительного наказания.

Наибольшая польза от маркера поощрения, например, щелчка кликера или слова «да» — это точный тайминг. С маркером у вас идеальный или почти идеальный тайминг отметки правильного поведения. Маркер — это как мостик между командой и лакомством. Как только произошло поведение, вы должны отметить его щелчком, а потом у вас есть несколько секунд, чтобы спокойно достать лакомство и дать его собаке.

Если у вас плохо с таймингом и вы постоянно запаздываете с кликом, вы можете непроизвольно, но постоянно подкреплять не то поведение, которого вы добивались от вашего подопечного. В лучшем случае это введет собаку в заблуждение, замедлит процесс обучения и расстроит вас обоих. В худшем – вы спровоцируете прямо противоположное поведение, все это закончится переучиванием или даже устранением нежелательного поведения.

Давайте представим, что вы обучаете собаку вежливо приветствовать гостей, выполняя команду «сидеть». Когда к вам приходят гости, собака у вас на поводке, чтобы вы могли предотвратить прыжки. Когда к вам заходит гость, собака идеально выполняет команду «сидеть» на входном коврике. Вы нажимаете на кликер, но пока вы нажимаете, собака успела подумать, что хвалить ее никто не планирует и как раз прыгает на тетушку Марту. Клик, ой! Конечно, вы не совершили никакой глобальной ошибки (если тете Марте не 90 лет и у нее не сломалось ребро от прыжка собаки). Но каждый раз, когда вы запаздываете с маркером, и даете его, когда ваша собака уже прыгает на гостя, а не сидит на выдержке, вы тем самым говорите собаке, что запрыгивать это хорошо, это поведение приводит к поощрению.

В данной ситуации есть преимущество у голосового маркера – слово «да» или щелчок языком. Если вы застигнуты врасплох и у вас нет кликера, то просто промаркируйте поведение голосом и подкрепите его лакомством, который наверняка лежит у вас в кармане.

Если вы поняли, что опаздываете со щелчком, даже когда кликер у вас наготове в руке, то вам нужно попрактиковаться с таймингом. Когда рядом нет вашей собаки (и она не может вас слышать), включите телевизор на спортивном канале и найдите теннисный матч. Смотрите внимательно. Каждый раз, когда теннисист отбивает мяч, нажимайте на кликер. Как только вы заметите, что ваш клик точно совпадает с ударом по мячу, вы можете приступать к дрессировке. (Заметим: такой вид отработки реакции не эффективен с гольфом и бейсболом.)

Ошибка № 5: Неуверенность в своих убеждениях

Если вы дрессируете собаку, а эффекта не видно, то вам может показаться, что сойти с пути будет лучше. Всегда найдутся друзья, единомышленники, семья и другие профессионалы, готовые с радостью указать на ваши ошибки, и посоветуют применить жесткие меры, припугнуть или хорошенько одернуть вашу непослушную собаку, чтобы заставить ее подчиняться.

Возможно вы тренер, который уходит от применения наказания в обучении, но ваш предыдущий успех в применении силовых методов постоянно нашептывает вам: «я мог бы дернуть за поводок разочек!»

СТОП!

Основная вещь, которую мы так ценим в положительной дрессировке – это доверие, которое вырастает между человеком и собакой. Ваша собака верит, что может пробовать разные варианты поведения, и они не приведут к боли. Вы дадите ей понять, когда она права, и не напугаете и не побьете ее, если она ошиблась. Когда вы разрушаете доверие, вы рискуете получить негативные поведенческие последствия, иногда очень значительные — от агрессии с одной стороны, до отказа от работы или выученной беспомощности с другой.

Когда собака становится агрессивной, ее будущее ставится под сомнение. Когда собака отказывается работать, и вообще теряет какое-либо желание, т.к. боится наказания, то дрессировка становится сплошным расстройством.

Использование принуждения одновременно с положительным подкреплением так же имеет очень серьезные последствия. Если вы наказываете собаку за невыполнение команды, которые вы считает она «знает», то вы «отравляете» команду, другими словами, наделяете команду плохими ассоциациями. Команда становится двусмысленной: животное не понимает, что она несет в себе – положительные вещи (клик и лакомство) или отрицательные (наказание). Двусмысленность порождает стресс и превращает счастливую собаку в собаку с поджатым хвостом, а энтузиазм ее совсем куда-то исчезает.

«Отравленную» команда сложно, а иногда и невозможно, восстановить. Если вы все-таки «испортили» команду, то лучше ввести новую, чем пытаться восстановить старую.

У вас всегда есть выбор, как вести себя с собакой. Один из моментов, который мне очень нравится в позитивном методе дрессировки, это множество возможностей для закрепления команд без принуждения и запугивания. Применение силы в таком методе пагубно скажется на последующих тренировках, так же как и отсутствия творческого подхода.

На недавнем семинаре, хозяин одного милого бернского зенненхунда признался мне, что ему «приходится» использовать принудительную апортировку (с щипком за ухо), хотя во всех остальных моментах он использует положительное подкрепление. Я вежливо предположила, что он не «вынужден» использовать такой метод, но захотел использовать его. Я не удивилась, когда мы начали шейпинг упражнения (когда собака предлагает разные варианты поведения), берн сел у ноги владельца, неуверенно глядя ему в глаза, не предлагая никаких вариантов поведений, в то время как остальные собаки в паре с хендлерами были увлечены шейпинг играми. Выбор хозяина зенненхунда в корне влиял на собаку и их отношения.

Положительные методы дрессировки работают. Если вы привержены положительным методам дрессировки, то вы найдете способ научить собаку апортировке, не щипая ее за ухо. Существует огромное множество прекрасных книг, видео, дрессировщиков и веб-сайтов, которые готовы помочь вам в решении ваших дрессировочных проблем. Вы можете также решить, что апортировка не стоит того, чтобы становится жестоким, лучше найти другой вариант совместного времяпрепровождения с собакой. Это ваш выбор. Делайте его с умом.

Пет Миллер, CBCC-KA, CPDT-KA, редактор журнала Dog Journal’s.

Дрессировка собак → Базовая → 10 главных принципов обучения собак

Чтобы достичь нужного взаимопонимания и контакта при дрессировке, рассмотрим десять основных принципов, которые непременно помогут в обучении вашего питомца. Самое важное: никогда не разрешайте запретное. К примеру, нужно, чтоб Ваша собака никогда не попрошайничала. Бывает, что вы позволяете себе подкормить собаку кусочками еды со стола, и в результате, тем самым, вы дадите повод собаке в другой раз терпеливо и долго ждать следующего такого случая, чтоб получить заветный кусочек. То есть, вы обнадеживаете собаку, которая ждать всегда может терпеливо и долго. Такой случай в процессе дрессировки называется вариативным подкреплением, определяющимся тем, что награду собака получает случайно, а не тогда, когда следует похвалить. Вариативное подкрепление является намного эффективнее постоянного. Оно тем сильнее стимулирует поведение, чем существеннее промежутки между подкреплениям. Словом, не разрешайте собаке никогда делать то, что вы бы не хотели, чтоб она делала. Будьте постоянными в требованиях к ней.

Второе правило – никогда не отменяйте свое приказание собаке. Допустим, вы даете собаке определенную команду, теперь постарайтесь добиться её выполнения, и не забудьте поощрить. В противном случае ваши команды станут пустыми словами для собаки.

Также следует иметь в виду, что нельзя запрещать то, что может быть допустимым. То есть при дрессировке собаки вы никогда не следили за правильностью и четкостью выполнения команды, поэтому не требуйте потом нормативного выполнения её. К примеру, вы обучаете собаку команде «Сидеть» – она при посадке заваливается набок или садится неровно. Вас это устраивало, но потом вы вдруг решили, что она должна сидеть ровно. А так как собака была обучена команде, придерживаясь того, что главное – это сидеть, и не важно как, то поэтому вы не имеете права уже требовать правильной посадки. Это ваше личное упущение, и вашего питомца следует заново обучать данной команде с нуля или оставить все как есть.

Принцип четвертый – понимание. Оно заключается в том, что как только собака станет вас понимать – все в ваших руках. Все действия ваши должны быть разумными и понятными для собаки, вы должны говорить как бы на собачьем языке.

Важным правилом взаимопонимания является доверие: если вы не будете обманывать собаку, то она никогда не обманет вас. Рассмотрим пример. Ваша собака боится уколов, а его просто необходимо сделать. Она, как всегда, прячется под диван, и все ваши попытки выманить на укол безрезультатны. Но она очень хорошо знает и понимает команду «Идем гулять», и вы этим пользуетесь. Получается, что вы обманули её, под предлогом прогулки сделали укол, и тем самым подорвали доверие вашей собаки к себе. После такого случая она обязательно сто раз подумает, перед тем как выполнить вашу любую команду.

Шестой принцип, о котором нужно всегда помнить называется ошибочность обучения. Это означает, что если собака выполняет что-то ошибочно, то виноваты в этом вы. Правильность выполнения собакой команд заключается в верном и четком обучении. К примеру, вы учите собаку ходить рядом с вами, применяя пищевое подкрепление (поощрение собаки кусочками пищи при правильном выполнении заданного вами действия). По сути, необученной собаке все равно, с какой стороны идти рядом с вами, около левой ноги или правой, спереди или сзади, или, может, вприпрыжку. Поэтому как вы её обучите, так она в дальнейшем и будет ходить рядом. Если вы держали кусочек еды сильно высоко, то собака будет идти вприпрыжку и пытаться достать лакомство. А если кусочек находился перед вами в процессе обучения, то и в последствии собака будет ходить не с ногой, а впереди вас и так далее. Таким образом, все зависит от точности вашего обучения.

Одним из основных правил является забота о питомце. Необходимо заботиться о здоровье собаки, и беречь её. Не забывайте посещать ветеринара, особенно если ваша собака стала легко возбудима или появилась излишняя агрессия – это может быть связано и со здоровьем. И никогда не требуйте от собаки непонятного и невозможного. Вы должны четко мотивировать свои действия и ставить реальные цели для собаки. В противном случае собака может потерять к вам уважение и доверие, так как для неё требования вожака (в данном случае вас) обязаны быть разумными.

Одним из ваших необходимых действий является контроль оценки способностей собаки: все же лучше недооценить их, чем переоценить. К примеру, вы уверены, что ваш питомец безукоризненно выдрессирован. Собака выполняет все команды безоговорочно, даже при различных отвлекающих факторах. Зачастую вы ходите с ней вдоль дороги без поводка, она же всегда ходит рядом. Но надо понимать, что собака – это живое существо, она может и сорваться, увидев знакомого человека или собаку, с которой часто играет, выходя гулять. Вариантов может быть много. Даже самое идеальное послушание не избавит вас от единичного срыва команды, стоящего даже жизни собаке.

И последний из принципов заключается в возможности потери уважения собаки. Это равносильно гибели всего тренировочного процесса. Вы окончательно и бесповоротно можете подорвать доверие собаки, если будете называть её просто так, выплескивая свой гнев, к примеру, или же требовать нечто непонятное и невозможное. Поэтому она раз и навсегда перестанет считать вас своим вожаком, и никогда не будет слушаться.

Поделитесь ссылочкой с друзьями:

Нашли ошибку? Сообщите нам об этом!

Время подачи подкрепления

Время подачи подкрепления

Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление — это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора «Да!» или «Хорошо!», отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: «Хорошая собака», собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, первый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в самый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыванием подкреплений.

Мы всегда слишком запаздываем подкрепляя друг друга. «Послушай, дорогая, вчера вечером ты выглядела замечательно», — звучит совсем не так, как та же фраза, сказанная вовремя. Отсрочка подкрепления может даже оказать вреднее воздействие («А что, разве я сейчас не выгляжу замечательно?»). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления. Слишком раннее подкрепление тоже неэффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, чтобы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда же служители клали пищу снаружи или подманивали ее бананами, горилла либо не обращала на них внимания, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служителям, что размахивание бананами и подбрасывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена.

Мне кажется, что иногда и детей мы подкрепляем слишком рано, находясь под ложным впечатлением, будто мы их подбадриваем («Молодец, хорошо, ты уже почти все сделала правильно»). Возможно, при этом мы подкрепляем попытки. Но существует разница между попыткой сделать что-то и выполнением этого. Причитания типа «я не могу» иногда отражают фактическое положение вещей, но они могут являться и признаками того, что часто подкреплялись просто попытки. Вообще, подкрепление поведения, которое еще не совершилось, — подарками, обещаниями, комплиментами или чем-нибудь в этом роде — ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего — выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед — тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают.

То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации «шумом».

Когда я смотрю по телевизору футбол или бейсбол, я всегда поражаюсь замечательной своевременности подкреплений, вновь и вновь получаемых игроками. Как только забивают гол или бегун пересекает финишную линию, рев толпы сигнализирует полное одобрение; а только посмотрите на бешеный обмен взаимоподкреплений игроков в тот момент, когда счет открыт или игра выиграна. С артистами, особенно с киноактерами, дело обстоит совершенно иначе. Даже на сцене аплодисменты раздаются после того, как работа кончается. У артистов кино не существует своевременного подкрепления, за исключением редкого отзыва режиссера или оператора об их работе или рукопожатия; письма поклонников и положительные рецензии, приходящие спустя недели и месяцы, бледнеют в сравнении с неистовством американского стадиона в минуту успеха. Нет ничего удивительного, что некоторые звезды кино проявляют болезненную страсть к низкой лести, и сенсациям; работа может совершенно не удовлетворять, если подкрепления, даже самые блестящие, всегда опаздывают.

Читайте также:  Как научить собаку правильному поведению, разрешая делать, что она хочет? Это вполне возможно!
Ссылка на основную публикацию