-

Belonen, belonen en nog meer belonen

Nikki de Kerf

“‘Snijd maar een kilo wortelen, dan hebben we in ieder geval genoeg’, zo moedigt Conrad van Pruijsen, alias de Clickercoach, mij aan. Ik ben benieuwd. De meeste trainingsmethoden raden voedselbeloningen af of verbieden het zelfs. Bij clickertraining daarentegen zijn voedselbeloningen de basis. In het begin dan en dat is precies waar we nu staan.” Hoofdredacteur Dorien van Dijk volgt met haar paard Iluso haar eerste clickertraining.

Met emmer vol schijfjes wortelen arriveer ik op stal. In gedachten zie ik mijn Spanjaard straks – na één druk op de clicker – op twee benen door de bak lopen, waarna ik hem beloon met een schijfje wortel. Wanneer Conrad arriveert, geef ik hem een hand en stel ik hem voor aan Iluso die al klaarstaat op de poetsplaats. Wij zijn er klaar voor. Maar zo vlot blijkt dat niet te gaan. Eerst krijg ik een stuk theoretische kennis, zodat ik straks beter weet hoe deze ‘mindgame’, zoals Conrad het noemt, werkt.

Vraag, gedrag, gevolg

De hele clickertraining bestaat uit drie stappen, die zich telkens herhalen: vraag, gedrag, gevolg. Ik stel Iluso straks een vraag, hierop geeft hij een reactie en als hij het snapt – ik verwacht dat dit bij mijn pientere paard geen probleem is – krijgt hij lol in het oplossen van de ‘puzzels’ die ik hem voorleg.

We gaan eerst ‘droog oefenen’. Ik speel paard en Conrad is de trainer. “Eh, je houdt wel heel veel van je paard hè…”, zegt Conrad, terwijl hij mijn emmer wortelen in het oog krijgt. “Een kilo zei je toch”, antwoord ik niet begrijpend. “Maar die schijfjes zijn wel heel erg dik. Die hadden veel dunner én door de helft gekund.” Antwoorden als ‘weet je wel hoe lang ik dan sta te snijden’ en ‘normaal breek ik een wortel gewoon in tweeën’ laat ik maar even achterwege. Maar goed, leermoment één: heel kleine voedselbeloninkjes zijn dus voldoende.

Denken als Iluso

En al snel begrijp ik waarom. Conrad begint schijnbaar willekeurig te klikken op het apparaatje dat hij om zijn pols heeft gehangen, terwijl direct daarop zijn andere hand in de buidel om zijn buik verdwijnt om daar een te dik schijfje wortel uit tevoorschijn te halen. Ik probeer mij te concentreren op mijn rol als ‘paard’, maar dat blijkt nog best lastig. Denken als Iluso (‘waar is die beloning’) lukt nog wel, maar de bijbehorende bewegingen uitvoeren zoals een paard dat zou doen, is best lastig. Daarbij lijkt het alsof Conrad maar blijft klikken bij elke beweging die ik als neppaard maak. “De gouden regel luidt: eerst klikken voor wat je krijgt en dan pas voor wat je wilt”, legt Conrad uit.

Lievelingssnoep

Dus in het begin wordt elke willekeurige reactie van je paard beloond met een schijfje wortel (of iets anders dat hij lekker vindt). Na een paar keer krijgt je paard door, dat de klik wordt gevolgd door de beloning. De eerst link is dan gelegd. Jouw paard wil graag dat je opnieuw op dat ‘klikding’ drukt, want dan krijgt hij weer zijn lievelingssnoep.

“Dit betekent wel dat je jouw paard verder nooit meer wortelen mag voeren”, zegt Conrad streng. “Echt niet?” stamel ik. “Ook niet als ik na het uitmesten van zijn stal, hem in de paddock heb gezet en daar nog een paar ‘afscheidsworteltjes’ voer?” “Nee”, klinkt het weer streng uit de mond van de clickercoach. “Als je iets gratis krijgt is het minder leuk, minder waardevol. Een beloning geef je omdat je paard iets goed gedaan heeft.” Ik snap de redenering, maar ik vind mijn paard altijd wel meewerkend en braaf. Het is ook gewoon leuk om hem iets lekkers te geven.

Vragen stellen

Alsof Conrad mijn gedachten kan lezen, zegt hij: “Als je paard weet dat hij die wortelen na de clickertraining of op een ander moment toch wel krijgt, dan speelt hij straks het spelletje niet meer mee. Eigenlijk is hij jou dan aan het clickeren: hoe eerder de training stopt, hoe eerder hij ongestoord die wortelen kan opknabbelen.” Eigenlijk wil ik nog zeggen dat mijn paard zóveel van wortelen houdt, dat ik denk dat hij er nooit genoeg van zal krijgen, maar er is iets dat ik nog veel liever wil weten: welke vraag stel ik mijn paard en hoe doe ik dat?

Conrad legt uit dat hij bij de eerste vraag met de zogenoemde ‘handtarget’ werkt. Het doel is dat je paard gaat snappen dat wanneer hij met zijn neus jouw recht vooruit gestoken hand aanraakt, de klik en de beloning elkaar naadloos opvolgen. “En je hoeft echt geen eeuwigheid te klikken, voordat je paard het door heeft. Wanneer je consequent het principe ‘klikken = belonen’ hanteert en niet langer dan tien seconden wacht met de beloning, zul je merken dat het heel vlot gaat”, vertelt de trainer.

Persoonlijke ruimte

We nemen de proef op de som. Mijn inmiddels wat ongeduldige PRE, wandelt nieuwsgierig met ons mee naar de paddock. Terwijl hij even zijn benen strekt en – natuurlijk – meteen gaat liggen rollen, doe ik de clicker om mijn linkerhand en gesp ik het buideltje met wortelschijfjes om mijn middel. We stappen gezamenlijk de paddock in. Iluso komt meteen naar ons toe met zijn (voor mij) welbekende houding: ‘leuk, wat gaan we doen’.

Conrad is iets minder gecharmeerd van het enthousiasme waarmee Iluso het stofje van zijn jas met zijn bovenlip betast, even aan zijn haar ruikt om vervolgens zijn hals te strekken richting het heuptasje met wortelschijfjes. Als ik de trainer aankijk, weet ik – nog  voor hij zijn mond opendoet – dat er nu een preek gaat komen over ‘het respecteren van de persoonlijke ruimte’. En wederom heeft hij gelijk. We werken weliswaar met een edel dier, maar ook hun zeshonderd kilo kan potentieel gevaarlijk zijn.

Handtarget-oefening

“We gaan de handtarget-oefening doen met een lijntje ertussen”, stelt Conrad. Het idee is dat Iluso in de paddock blijft en ik aan de andere kant van de draad mijn arm (met clicker) recht vooruit steek. Na een paar keer klikken heeft Iluso al door dat hij wat lekkers krijgt, als ik klik. Na nog een paar keer klikken zie ik hem ‘de klik zoeken’. Hij zwaait met zijn hals heen en weer: wanneer gaat dat ding nu af?

Op advies van Conrad word ik iets selectiever met klikken, volgens het principe: warm, warmer, warmst. Dus als mijn paard zijn neus in de richting van mijn hand steekt, klik ik en geef ik hem een wortelschijfje. De keer erop klik ik pas als hij zijn neus nog dichter bij mijn vooruitgestoken hand brengt. Ik moet oppassen dat ik nu zelf niet te enthousiast wordt, en de beloning alvast tevoorschijn haal nog voordat ik heb geklikt. De volgorde der dingen is immers van cruciaal belang.

Wijze van belonen

Het enige dat bij deze eerste oefening nog niet lekker loopt, is de wijze waarop ik de beloning aan mijn paard geeft. Ik dien een pas naar voren te zetten, mijn arm met beloning daarbij uitgestrekt te houden, waarop mijn paard respectvol een stapje achteruit zet en het schijfje wortel uit mijn hand eet. Ik denk dat de draad tussen ons in de boosdoener is. Iluso kent de werking van schrikdraad en hoewel er vandaag geen stroom op de draad staat, weet hij maar al te goed dat hij zijn hoofd beter niet overheen kan steken.

We stappen weer terug de paddock in. Hoewel Iluso onverminderd enthousiast mijn ruimte in stapt, besluiten we dit maar even te negeren en door te gaan met de eerste vraag: raak met je neus mijn uitgestoken hand aan, dan klik ik en krijg jij een schijfje wortel. Terwijl we hieraan werken, stap ik bij het geven van elke beloning consequent vooruit en zet Iluso een flinke pas terug. Ook dit ritueel slijt er al snel in bij mijn paard. Wanneer Iluso doorheeft dat hij mijn uitgestoken hand moet aanraken, vraagt Conrad mij de posities van mijn arm te variëren: arm naar links, arm omhoog, arm omlaag. Het gaat super, totdat… Iluso een wortelschijfje laat vallen.

Aandacht bij mij

Terwijl mijn paard op zoek gaat naar het verloren stukje oranje goud, sta ik als aan de grond genageld. Dit hebben we nog niet geoefend. En wat ik altijd doe in nieuwe situaties die mij overvallen: ik bevries en denk na. Time out! “Dat is in ieder geval niet het juiste antwoord op de situatie”, zegt Conrad droogjes.

Ik had het vallende schijfje wortel moeten negeren en direct door moeten gaan met de volgende klik. Dan had ik mijn paard opnieuw beloond en was hij weer met zijn aandacht bij mij geweest. In plaats daarvan stond ik nu een beetje schaapachtig te kijken hoe hij met zijn flexibele bovenlip heel behendig het schijfje wortel uit het zand viste. Gelukkig was het niet zo’n klein stukje…

Pasje terug

We gaan door naar oefening twee. Hierbij stellen we de vraag: ‘zet een paar passen achteruit’. Daarvoor moet ik met mijn uitgestrekte linkerarm en linker wijsvinger naar voren wijzen en tegelijkertijd het commando ‘terug’ uitspreken. De grote valkuil bij deze oefening is volgens Conrad dat wij bij het stellen van deze vraag druk gaan uitoefenen met onze lichaamshouding (ons groot maken, naar voren leunen) of onze stem (harder praten of onze stem zwaarder laten klinken).

De trainer vraagt netjes of hij daarom mijn schouders even mag vasthouden. Vooruit dan maar, de persoonlijke ruimtes waren door Iluso toch al geminimaliseerd. Ik wijs naar voren en zeg zo luchtig als ik maar kan ‘teeerugg’. Meteen denk ik even terug aan het theoriegedeelte, waarin Conrad beweerde dat clickertraining de meest vrijwillige training is die er bestaat. “Vrijwillig, maar niet vrijblijvend”, voegde hij er waarschuwend aan toe. En dat blijkt wel te kloppen. Alleen als je consequent reageert op de gedragingen van je paard, boek je resultaat.

Achteruit

Braaf zet mijn PRE een paar passen achteruit. Ik ga met uitgestrekte arm er achteraan om hem een wortelschijfje te presenteren. Hoe leuk is dat! Vraag twee heeft mijn paard ook al onder de knie. De eerste trainingsmodule van de clickercoach bestaat uit zeven vragen. De volgende vragen zijn ‘hoofd laag’, ‘ho’, ‘volg’, ‘blijf’ en ‘ga’. Die laatste lijkt me de lastigste. Hoe krijg je een paard dat gefocust is op een beloning zover dat hij bij je weg wandelt?

Dit blijkt de cliffhanger. We zijn inmiddels al ruim twee uur bezig en de emmer met wortelen begint al aardig leeg te raken. Om het einde van de sessie kracht bij te zetten, trekt Conrad met zijn handen een denkbeeldige lijn door de lucht en zegt hij stellig ‘klaar’. Ook dit moet je consequent na elke sessie herhalen, net zoals je elke sessie begint met drie keer klappen in je handen.

“In het begin is voedsel echt de primaire beloning. Na verloop van tijd wordt dat minder en vindt het paard werken met jou vooral leuk. Het is een dynamisch spelletje, waar je samen veel plezier aan kunt beleven. Na een poosje beloon je alleen de moeilijkere oefeningen”, zo schetst Conrad het verdere verloop van de training. Tegen die tijd ben je heel wat clicks en heel veel emmertjes met wortelschijfjes verder, denk ik bij mezelf. Dat mijn paard op twee benen door de paddock wandelt voor een wortelschijfje is voorlopig dus nog toekomstmuziek…


Hoe leert een paard?

De twee belangrijkste manieren waarop dieren leren zijn door klassieke conditionering en operante conditionering. Bij beide vormen van conditionering worden er associaties gelegd tussen verschillende gebeurtenissen. Bij klassiek conditioneren is dat de associatie tussen twee gebeurtenissen in de omgeving en bij operant conditioneren is dat de associatie tussen het eigen gedrag en een gebeurtenis in de omgeving.

Een voorbeeld van klassieke conditionering is als de hond het geluid van de rijdende kar met krachtvoer associeert met eten krijgen. Een ander voorbeeld is dat veel paarden het ritueel van wassen en invlechten koppelen aan het ‘op wedstrijd gaan’. Ze hebben door associatie geleerd dat het op het invlechten van de manen een wedstrijd volgt.

Consequenties van gedrag 

Bij operante conditionering leert een paard wat de consequenties van bepaald gedrag zijn. Gedrag dat hem iets positiefs oplevert zal hij herhalen, gedrag dat hem iets negatiefs of niks oplevert, zal hij niet herhalen. Als jij je paard voert en je paard wordt druk, dan zal dit elke keer erger worden. Wacht je met het geven van voer tot hij weer rustig is, dan leert hij dat zijn drukke gedrag niets oplevert.
Bij clickertraining wordt gewenst gedrag dus beloond. Ongewenst gedrag wordt niet gestraft, maar zoveel mogelijk voorkomen. Dit vraagt enige creativiteit van de trainer. Maar niet alleen jij, ook je paard leert creatief denken van clickertraining.

Doordat er bij clickertraining niet met straf, dreiging of dwang wordt gewerkt, is deze trainingsvorm voor jou én je paard een ontspannen bezigheid.
Een ander voordeel van clickertraining is dat je goed leert te kijken naar je paard. De paard op zijn beurt neemt actief deel aan het leerproces door zelf te leren nadenken welk gedrag hem een click, en dus een beloning oplevert. Training is dus een interactief proces, waarbij samenwerking centraal staat. Met clickertraining leer je niet alleen allerlei gedragingen en oefeningen aan, maar werk je ook actief aan de versterking van de band tussen jou en je paard.


Bron: Bit 243