kliker.doc

(64 KB) Pobierz
Szkolenie klikerowe (clicker training)

Szkolenie klikerowe (clicker training) - jest metodą szkolenia używającą nagradzania (pozytywnego wzmocnienia) za pożądane zachowanie. Moment, kiedy to pożądane zachowanie się pojawia jest zaznaczony dźwiękiem klikera (lub innym, np używa się gwizdka w przypadku delfinów).
Ten zaznaczający dźwięk jest często nazywany mostem pomiędzy zachowaniem a nagrodą.
Szkolenie kliperowe opiera się na zasadzie: zachowanie nagrodzone będzie powtórzone przez psa. Jest to również sposób porozumiewania się ze zwierzęciem, bardzo jasny, precyzyjny i łatwy dla niego do zrozumienia.
Celem tego szkolenia jest zrozumienie przez psa, ze to jego zachowanie powoduje pojawienie się nagrody. Pies ofiarowuje nam jakieś zachowanie, bo jest to w jego interesie. Nasz cel staje się celem psa. Całkowita zgodność interesów daje nam psa wykonującego komendy z radością, psa który jest naszym partnerem, a nie niechętnym niewolnikiem

KLIKER  to małe pudełko, które wydaje odgłos klik-klak. Do czego służy? Przy uczeniu zachowań bardzo ważne jest, aby nagroda była dostarczona dokładnie w momencie pożądanego zachowania, natomiast gdy podajemy np. smakołyk zawsze robimy to z opóźnieniem. Dlatego używa się klikera, dzięki niemu możemy bardzo precyzyjnie zaznaczyć zachowanie o które nam chodzi. Każde KLIK-KLAK oznacza dla psa, że dostanie smakołyk (nagrodę) za to co robił w chwili kliknięcia.

Czy koniecznie kliker?

Po co dodatkowo używać dźwięku, jeżeli można dać psu nagrodę lub pochwałę "dobry piesek"?

Otóż dźwięk klikera jest specyficzny, łatwo wyróżniający się spośród natłoku odgłosów, które zwierzę słyszy na co dzień. Pies nie może pomylić go z żadnym innym i zawsze kojarzy mu się z nagrodą.

Bardzo ważnym elementem szkolenia, niezależnie od tego, jaką metodę stosujemy, jest szybkość naszej reakcji. Odpowiedź na właściwe zachowanie zwierzęcia musi być natychmiastowa - ułamek sekundy, a dźwięk klikera jest krótki. Kliknąć możemy bardzo szybko, w momencie danego zachowania. Pochwała słowna lub podanie smakołyku trwa znacznie dłużej. Pies zdąży już zrobić coś innego, zanim dostarczymy mu nagrodę i nasze nagrodzenie tego zachowania nie będzie precyzyjne, a co za tym idzie, nie będzie skuteczne. Łatwo jest też zdekoncentrować psa mówiąc do niego zbyt wiele.

 

Dźwięk klikera dokładnie akcentuje właściwy moment i oznacza dla psa:

 

- ze zarobił nagrodę

 

- to co robił w momencie kliknięcia spowodowało pojawienie się tej nagrody

 

 


 

 

PODSTAWOWE POJĘCIA DOTYCZĄCE UCZENIA SIĘ:

 

 

odruch bezwarunkowy – odruch wrodzony, odziedziczony po przodkach, np. wydzielanie śliny przy jedzeniu

 

odruch warunkowy – odruch nabyty, wyuczony (pies któremu zawsze przy jedzeniu zapalano niebieskie światło, wydziela ślinę na sam widok światła);

 

warunkowanie – wytwarzanie odruchów warunkowych klasycznych i instrumentalnych.

 

warunkowanie klasyczne -  kojarzenie bodźca warunkowego (biologicznie obojętnego) z bodźcem bezwarunkowym; (wyrabiania skojarzeń typu np: dźwięk dzwonka z porażeniem prądem, kliknięcie ze smakołykiem)

 

warunkowanie instrumentalne - kojarzenie reakcji warunkowej z bodźcem bezwarunkowym (np. pies ciągnie – zostaje szarpnięty; pies siada – dostaje piłeczkę…)

 

 

 

Wzmocnienie (reinforcement) R

(wzmacnia zachowanie)

Wygaszenie (punishment) P

(wygasza zachowanie)

Coś pozytywnego

"+"

(coś jest dodane)

Pozytywne wzmocnienie R+

Coś jest dodane do otoczenia, co zwiększa prawdopodobieństwo wystąpienia danego zachowania w przyszłości

Np. pies podaje łapę i dostaje za to smakołyk.

 

Pozytywne wygaszenie P+

Coś jest dodane do otoczenia, co zmniejsza prawdopodobieństwo wystąpienia danego zachowania w przyszłości.

Np. krzyczymy na psa za to ze załatwił się na dywanie.

 

Coś negatywnego

"-"

(coś jest zabrane)

Negatywne wzmocnienie R-

Coś jest zabrane z otoczenia, co zwiększa możliwość wystąpienia danego zachowania w przyszłości.

Np. przestajemy szarpać psa, jak idzie przy nodze

Negatywne wygaszenie P-

Coś jest zabrane z otoczenia, co zmniejsza możliwość wystąpienia danego zachowania w przyszłości.

Np. przestajemy iść do przodu gdy pies ciągnie.

 

 

Przykłady:

- danie psu smakołyka za przybiegnięcie na wołanie(R+)

- otrzymanie zapłaty za pracę (R+)

- puszczenie psa ze smyczy gdy ciągnie (R+)

- zatrzymanie samochodu w drodze na lody, jeżeli dzieci się biją z tyłu(P-)

- pies jest zapięty na smycz i zabrany z parku po powrocie do pana, (P-)

- naciskanie ręką na psa gdy nie chce usiąść(P+)

- szok elektryczny za szczekanie(P+)

- uderzenie w stół gdy pies podchodzi do nas podczas jedzenia(P+)

- ustawiamy psa ręką przy nodze (R-)

- krzyczymy na współlokatora tak długo aż nie pozmywa talerzy(R-)


 

OTRZYMYWANIE ZACHOWAŃ:

 

Mamy psa i teraz chcemy by zrobił coś, za co możemy kliknąć i nagrodzić. W jaki sposób uzyskać zachowanie do nagrodzenia? Są 3 sposoby otrzymywania zachowań:

Sposoby otrzymywania zachowań

 

1) naprowadzanie

Zachęca się psa w jakiś sposób do konkretnego zachowania (kiedy już to zrobi, klikamy i nagradzamy); możemy przesuwać psu smakołyk przed nosem, tak żeby ustawił się w pożądanej pozycji. Np. naprowadzamy na „siad” jak usiądzie klikamy i nagradzamy

 

2) wyłapywanie

Czekamy aż pies sam zaofiaruje zachowanie którego chcemy nauczyć, i kiedy widzimy, że je robi klikamy i nagradzamy. Możemy np. wyłapać turlanie się, ziewanie, robienie kóleczek czy patrzenie na nas.

 

 

 

3) kształtowanie

polega na klikaniu kawałków zachowania, prowadzących do końcowego zachowania, takie mówienie psu 'ciepło, ciepło'. Np. uczymy targetowania nosem: zaczynamy od klikania/nagradzania spojrzenia, potem przysunięcia głowy, następnie obwąchiwania targetu aż uzyskujemy mocne i świadome dotykanie nosem.

 

SZKOLENIE TO MECHANICZNA UMIEJĘTNOŚĆ

Szkolenie psa dzieli się na dwie składowe: zachowania jakie prezentuje pies oraz umiejętności techniczne trenera. Ciężko jest nauczyć czegoś zwierzę jeśli sami nie umiemy w odpowiednim momencie kliknąć, podać sprawnie smakołyk czy pobawić się z psem. Nawet doświadczonym szkoleniowcom zdarza się kliknąć kawałkiem szynki, pakując przy tym kliker psu do pyska.

 

Ø       TIMING – termin angielski, na polski można to przetłumaczyć jako doskonałe wyczucie czasu. W szkoleniu klikerowym mamy na myśli umiejętność wzmocnienia zachowania (kliknięcia) dokładnie w czasie gdy ono zachodzi – tak jakbyśmy chcieli sfotografować to zachowanie.

 

PRACA Z PSEM:

Ważne jest to jak żwawo pracujemy – jeśli trener pracuje z energią, to i pies szybko się uczy; jeśli trener jest powolny to pies wolno się uczy. Im częściej klikamy / nagradzamy tym mniej dajemy szansy psu na rozpraszanie czy złe zachowanie (pies musi się lepiej skupiać).

 

Jeśli nie jesteśmy pewni czy powinniśmy psa nagrodzić to należy wtedy nagrodzić. Lepiej nagradzać zbyt dużo, niż zbyt mało.

 

Jeśli klikniemy przez pomyłkę nie wtedy kiedy chcieliśmy, to trzeba dać psu nagrodę. Pies ma ufać, że każde kliknięcie oznacza nagrodę.

 

Sesje szkoleniowe powinny być krótkie. Jedna sesja to 5 kliknięć. Naraz nie robimy więcej niż 5 sesji.

 

Nie pracujemy za psa! To pies ma do nas podchodzić i oczekiwać pracy. Na początku możemy starać się go w jakiś sposób sobą zainteresować, ale nie gonimy za psem, który nas olewa.

 

Jeśli chcemy, żeby pies był skoncentrowany na nas, my też musimy być w pełni skoncentrowanym na nim. (jeśli w chwili gdy pracujemy z psem zadzwoni telefon, my się odwrócimy to ukarzemy psa za to co w danym momencie robił)

 

Powoli zwiększamy KRYTERIA, lepiej zatrzymać się na pewnym poziomie zbyt długo, niż przeskoczyć za szybko do przodu. Pies może uznać ćwiczenie za zbyt trudne i zniechęcić się do pracy.

 

Naukę nowego zachowania zaczynamy w „łatwych”, mało rozpraszających dla psa warunkach (np. w domu). Kiedy już coś umie stopniowo dodajemy rozproszenia. Na przykład najpierw ćwiczymy w pustych miejscach, aż stopniowo dojdziemy do pracy przy grupie bawiących się psów.

 

 

MOTYWACJA:

jedzenie – każdy pies je; jeden jest bardziej łakomy drugi mniej, ale każdego psa można szkolić za pomocą jedzenia. Dobrze jest przyjąć zasadę – nic za darmo – i wykorzystywać całą porcję dzienną psa na szkolenie.

 

Piłeczka (zabawka) – dla większości psów piłeczka sama w sobie nic nie znaczy; dopiero z czasem, jeżeli przewodnik często się z nim bawi, nabiera znaczenia

 

Zabawa – każdy pies ma wrodzone pewne predyspozycje do określonych zabaw;

-  bieganie za rzuconym przedmiotem

-  przeciąganie się

-  zabawa w ganianego  - pies ucieka ze zdobyczą

- posiadanie przedmiotu

- nie interesują się żadną zabawą z przedmiotem

 

 

Zmienny i stały system nagradzania: (dotyczy zachowań których pies już się nauczył)

Nauczone zachowania: Nie klikamy w momencie gdy nie mamy zamiaru psa niczego uczyć, natomiast wciąż powinniśmy nagradzać psa za wykonywanie poleceń.

 

Stały system nagradzania: zadania wyuczone nagradzane w stosunku 1:1 są bardziej podatne na wygaszenie.

Zmienny system nagradzania: ten system pozwalał uzyskać zachowania trwalsze, bardziej odporne na wygaszanie. Spadała natomiast jakość wykonywanych zadań. Sposób jest o tyle trudny do zastosowania w życiu codziennym, gdyż jeśli my nie nagrodzimy psa, on często może nagrodzić się sam (pobiec do psów, pogonić kota).

Dobrze się sprawdza wprowadzenie różnorodności nagród, czyli raz to jest smakołyk, raz pochwała, raz zabawa patykiem, który akurat leży na trawniku, a raz pozwolenie na pobieganie z psami.

 

 


 

1

 

...
Zgłoś jeśli naruszono regulamin