Trainingstechnisch: Jackpots

De mystiek rond de jackpot: hulpmiddel of bijgeloof? – Ken Ramirez

 

Een verwarrend hulpmiddel

Tijdens mijn wereldwijde lezingen over training, zijn er bepaalde vragen die steeds terugkomen. Volgende onderwerpen lijken de meeste verwarring en discussie te veroorzaken: het ‘einde van een sessie’ signaal, het ‘ga door’ signaal, minst belonende scenario en jackpots. Mogelijks is dit zo omdat informatie over deze concepten niet zo voorradig is in de wetenschappelijke literatuur. Deze methoden zijn ontwikkeld vanuit de praktische kant van trainen en werden aangeprezen door trainers die bepaalde concepten duidelijker moesten maken voor hun dieren. Dit heeft er toe geleid dat er voor deze methoden geen consistente of algemeen geaccepteerde definities zijn.

Dit artikel gaat over mijn definitie van de term, het gebruik van jackpots, de mystiek die rond deze methode hangt en veelgemaakte fouten bij het gebruik van jackpots. Uiteindelijk, deel ik ook wat suggesties om door alle informatie over een niet zo duidelijke methode heen te gaan.

De ‘fix-it’ vis

Mijn eerste kennismaking met het gebruik van een jackpot is enkele tientalle jaren geleden. Als jonge trainer werkte ik met dolfijnen en gebruikte ik een assortiment van vissen als bekrachtigers. Een van de dolfijnen was verzot op makreel,  maar omwille van verschillende voedingskundige redenen, mocht elke dolfijn slechts één van deze grote vissen per dag eten. Het was een sterk gewaardeerde bekrachtiger voor de dolfijnen en deze werd voorbehouden voor speciale doorbraken in de training. Als één van ons een nieuw gedrag aan het aanleren was, hadden we onderling steeds discussies over wie van ons de vis zou gaan gebruiken in zijn sessie. Als een bepaald gedrag problemen had om aan de gestelde criteria te voldoen, dan reserveerden we de vis voor dat moment waarop het dier uitzonderlijk goed presteerde en voldeed aan alle criteria. We noemden deze bekrachtiger de ‘fix-it’ vis; de trainingsdirecteur zei ons dat het een jackpot was. Ik herinner mij dat ik als jonge trainer onder de indruk was van de waarde van deze magische bekrachtiger.

Is de jackpot een uniek hulpmiddel, of is het enkel het gebruik van een goede, well-getimede bekrachtiging?

 

Ik kan mij duidelijk herinneren dat het gebruik van die vis hielp bij zowel het corrigeren van probleemgedrag als het bekrachtigen van specifieke doorbraken in training van nieuwe gedragingen. Of is die herinnering toch vertroebeld doorheen de tijd? Of is het een fantasievolle mythe die vereeuwigd werd door ons verlangen als trainers naar die ongrijpbare, magische bekrachtiger? Ik ben niet zeker. Ik ben jackpots blijven gebruiken in mijn training, zij het slechts sporadisch. Maar, bij het bestuderen en onderzoeken van de wetenschap die training ondersteunt, blijf ik op volgende vraag botsen: ‘is de jackpot een uniek hulpmiddel, of is het enkel het gebruik van een goede, well-getimede bekrachtiging?’

 

Definitie:

Aangezien de jackpot niet als dusdanig voorkomt in de wetenschappelijke literatuur, hebben trainers deze term genomen – zoals gebruikt in casino’s, loterijen en andere gokspelletjes – en hun eigen unieke definitie gecreëerd. Men zou kunnen stellen dat eender welke definitie van het gebruik van een jackpot als trainingshulpmiddel een juiste is, aangezien er geen wetenschappelijk referentie bestaat voor een consistente definitie. Voor het doel van dit artikel, wil ik zelf een definitie voorstellen die een combinatie is van de definitie door Karen Pryor (1984; 2006), the zoological community (AZA, 2017), en mijn eigen discussies met en observaties van professionele trainers die de methode goed lijken te gebruiken.

Een jackpot is een onverwachte, hoogwaardige bekrachtiger die op spaarzame en contingente manier gebruikt wordt om een significante doorbraak in training te bekrachtigen.

Uitdagingen bij het gebruik van een jackpot

Zelfs als we het eens geraken over een definitie, is dat nog geen garantie voor een consistente toepassing van de jackpot. Ik heb al meerdere malen waargenomen hoe het gebruik van deze methode meer kwaad deed dan goed.

Dit zijn de grootste uitdagingen:

  1. Gespreide beloning, bv. het ene brokje na het andere – Bij het aanbieden van de bekrachtiger, heb ik gezien dat trainers 10 voertjes geven als een jackpot. Maar in plaats van alle voertjes in 1 keer te geven, worden ze één voor één aangeboden. Tegen de tijd dat het laatste voertje is gegeven, zijn er meerdere seconden voorbij gegaan. Het is dan ook twijfelachtig of de latere beloningen nog geassocieerd worden met het excellente gedrag dat de trainer wilde versterken. Het is waarschijnlijk dat de latere beloningen het dier enkel bekrachtigen om in positie te blijven en aandacht te hebben voor de trainer. Deze resultaten zijn niet slecht, maar het zijn niet de reacties die de trainer wilde versterken.
  2. Slordige aflevering – Soms gooien trainers een handvol voertjes op de grond; als de voertjes zich over de grond verspreiden, kan het dier in paniek geraken bij het zoeken naar alle voertjes. Tenzij het dier getraind is om beloningen op deze manier te krijgen en dit leuk vindt, kan deze manier van voertjes aanbieden ook aversief werken. Dit in het bijzonder wanneer er meerdere dieren in de ruimte aanwezig zijn waardoor deze vorm van voertjes aanleveren een competitie voor het eten veroorzaakt.
  3. Veelvuldig gebruik – Eén van de veronderstelde voordelen van de jackpot is verbonden aan het feit dat het zelden gebruikt wordt. Als het te vaak gebruikt wordt, dan creëert de jackpot bij de leerling de verwachting dat grote of hoogwaardige beloningen voor een bepaald gedrag vaak voorkomen en dus verwacht worden. Deze veronderstelling kan er voor zorgen dat minderwaardige beloningen als aversief beschouwd kunnen worden. Ik ben niet tegen het consistent gebruik van hoogwaardige bekrachtigers voor een belangrijk gedrag; ik denk dat het nuttig kan zijn. Ik zou er echter niet naar verwijzen als een jackpot.
  4. Te nieuw – Sommigen beweren dat één van de voordelen van de jackpots de nieuwigheid is. Ik heb echter trainers gezien die jackpots aanboden die zo nieuw waren, dat de dieren bang of verward werden en dus het tegengestelde effect hadden.
  5. Gebruik van een marker(ing, bv. clicker) – Er bestaan verschillende meningen bij de gebruikers van een jackpot over de juiste timing. Sommigen leveren de jackpot meteen na de markering. Dit is ook de manier waarop ik zelf de jackpot meestal gebruik. Anderen beweren dat de jackpot maar effect heeft als hij gebruikt wordt in plaats van de markering. Deze techniek werd voorgesteld door Karen Pryor (2006) en heb ik zelf ook in bepaalde situaties gebruikt. Dit onderwerp vraagt duidelijk verder onderzoek.

 

Onderzoek naar de jackpot

Tot nu toe, hebben pogingen tot het bestuderen van de jackpot onder gecontroleerde omstandigheden, niet veel aan het licht gebracht. Eén bestaande studie heeft niet kunnen aantonen dat het gebruik van de jackpot een effectief trainingsmiddel is (Muir & Rosales-Ruiz, 2009). Maar deze studie gebruikte niet de definitie of toepassing van de jackpot die naar mijn ervaring het meest succesvol blijkt; de jackpot in de eerder vernoemde studie werd niet contingent gebruikt met een significante doorbraak.

Een onderwerp waar wel meer onderzoek bestaat, is dat van ‘conjugate reinforcement’  (Rapp 2008). ‘Conjugate reinforcement’ is het idee dat uitzonderlijke inspanning of toegenomen intensiteit van een gedrag, bekrachtigd wordt met een hoogwaardigere beloning dan gedrag met een lagere intensiteit of sterkte Dit is een proces dat werd geïdentificeerd en bestudeerd en ‘conjugate reinforcement’ is ook de reden waarom trainers succes ervaren met het gebruik van hoogwaardige bekrachtigingen.

Er bestaan echter ook studies die aantonen dat een afwisseling in de waarde van bekrachtigingen juist leidt tot wisselende leerresultaten in plaats van meer betrouwbaarheid. Voor gedragingen die een grotere intensiteit vragen, zoals een snellere ‘kom-hier, lijkt het er op  dat een hoogwaardige bekrachtiging effectief is voor het creëren van de variatie, die de trainer de kans geeft om de gewenste toename in intensiteit te selecteren en bekrachtigen. Wanneer de variatie echter invloed heeft op de precisie van het gedrag, is een hoogwaardige bekrachtiger meer een afleiding met misschien zelfs een negatieve impact. Het is deze anomalie die twijfel veroorzaakt over het gewenste effect van de jackpot op leerervaringen.

 

Al onze verhalen over de effectiviteit van de jackpot blijven slechts anekdotes, totdat trainers beginnen met het grondig bijhouden van hun gegevens over hun gebruik van de jackpot.  

Totdat trainers starten met het verzamelen en grondig bijhouden van gegevens over hun gebruik van de jackpot, inclusief een consistente meting van de manier waarop de jackpot gedrag beïnvloedt, zijn alle onze stellingen over de werking van de jackpot slechts anekdotes. Hoewel ik nog steeds gebruik maak van jackpots tijdens mijn trainingen, vraag ik mij af of ik gewoon een hoogwaardige bekrachtiging toepas op een soort van intermitterend schema. Die vraag, in combinatie met het feit dat ik mijn gebruik van bekrachtigingen continu verander en aanpas aan de noden van de leerling, maakt dat het erg moeilijk is om zeker te zijn dat een grote verbetering in het leren van het dier alleen te maken heeft met het gebruik van de jackpot of een gevolg is van een combinatie van factoren, waaronder de reeds bewezen impact van ‘conjugate’ bekrachtigers.

Ik heb, bijvoorbeeld, vaak verkondigd dat de excellente reacties van mijn dieren op het ‘hier komen’, het gevolg zijn van het feit dat ik af en toe de jackpot gebruik voor uitzonderlijke snelheid. Dit zou waar kunnen zijn. Maar er zijn zo veel andere factoren die een rol spelen bij de training en waarschijnlijk bijdragen tot het succes van de ‘kom-hier’. De voornaamste reden voor het succes is waarschijnlijk te wijten aan mijn gebruik van hoogwaardige bekrachtigers voor alle goed uitgevoerde reacties op het ‘kom-hier’ commando en een geleidelijke verhoging van de criteria voor snelheid. Ik geef wel degelijk verrassings- en onverwachte bekrachtigingen van een hogere waarde als mijn dieren uitzonderlijk snel reageren. Maar misschien is dat maar een bijgelovig gedrag van mijn kant? Ik kan niet aantonen dat de ‘kom-hier’ van dieren die zonder de jackpot getraind worden minder snel of betrouwbaar zou zijn, maar, gezien het belang van de ‘kom-hier’ oefening en het succes dat ik heb ervaren, sta ik erg weigerachtig ten opzichte van een aanpassing van mijn trainingstechniek voor dat gedrag.

Gebruiken of niet?

Gebaseerd op mijn persoonlijke ervaring, heeft mijn eigen gebruik van jackpots nooit een negatieve impact op mijn training gehad. De voordelen blijven echter maar een vermoeden, ideeën gebaseerd op succesvolle resultaten, aangezien er geen ondersteunende gegevens bestaan als referentie. Ik ga de jackpot zeker blijven gebruiken als hulpmiddel, maar ik ga wel voorzichtig zijn dat ik de effectiviteit niet te hoog ga inschatten – noch zijn bestaan als een echt hulpmiddel. Voorlopig ga ik enkel stellen dat ik gebruik maak van contingente, hoogwaardige bekrachtiging en ga ik daar geen speciale naam op plakken.

 

Ik ben van plan om op zoek te gaan naar manieren om gegevens over het gebruik van de jackpot te verzamelen, meten en interpreteren. Ook moedig ik anderen aan om hetzelfde te doen.

Ik hoop dat we allemaal kunnen beginnen met het vinden van een gezamenlijke definitie van het concept ‘jackpot’. Alleen op die manier kunnen we de verwarring die rond dit hulpmiddel hangt, opheffen.

 

Veel geluk met trainen,

Ken

Bron: https://www.clickertraining.com/the-jackpot-mystique

Vertaald door: Ilse Demandt

Bijkomende informatie:

AZA (2017). AZA animal training terms and descriptions. From AZA Professional Development Courses. www.aza.org

Muir, K & Rosales-Ruiz, J. (2009). The effects of jackpots on frequency of response and choice. Presented at Association for Behavior Analysis Conference.

Pryor, K. (1984). Don’t Shoot the Dog.

Pryor, K. (2006). Jackpots: Hitting it Big. In: Letters from Karen. https://www.clickertraining.com/node/825