Renforcement et punition

Différence entre Renforcement et Punition ?

Le renforcement est une action volontaire ou involontaire visant à fixer un comportement, augmentant ainsi les chances qu’il se reproduise, renforçant également son intensité et sa fréquence de réapparition. Les punitions sont vouées à éteindre un comportement, limitant les chances qu’il se reproduise, son intensité et sa fréquence de réapparition. Ainsi les renforcements fonctionnent s’ils sont en lien avec une action ou un objet (alimentaire ou non) que le chien souhaite obtenir (friandise, jouet, caresses, félicitations, activité, rencontres…). Il est important d’avoir à l’esprit que tout ce que le chien désire permet le renforcement, que l’humain cherche à renforcer ou pas, un comportement. Au contraire, tout ce que le chien ne désire pas, tout ce qui lui est désagréable, contribue à supprimer un comportement.

Les renforcements positifs (+) et négatifs (-) et les punitions positives (+) et négatives (-)

Il existe deux principes de renforcement (positif et négatif) et deux principes de punition (positive et négative).

Les termes « + » et « – » ne signifient pas, dans le concept de l’éducation animale, ce qui est « bien » ou « mal » :

   Le « + » signifie que l’on rajoute un stimulus attractif ou répulsif
   Le « » signifie qu’on le supprime un stimulus attractif ou répulsif.

Le renforcement Positif : un stimulus appétitif qui apparaît à la suite d’un comportement

Un renforcement positif apporte de la satisfaction à l’animal, c’est une « Récompense » qu’elle soit volontaire ou non.

Exemple de renforcement positif à la suite d’un comportement indésirable.

Vous êtes à table et vous donnez un bout de nourriture à votre chien. Vous avez toutes les chances qu’ils viennent systématiquement quémander lorsque vous êtes en train de manger, il pourra ainsi par la suite venir se servir directement sur la table surtout si elle est à sa portée.

Vous avez fait, sans le savoir, un renforcement positif Involontaire.

Lorsque vous promenez votre chien et qu’il croise un congénère sociable qui aimerait bien jouer avec lui. Si votre chien se réfugie dans vos jambes et que vous le caressez pour le rassurer, vous lui signifiez :« tu as peur, tu as raison ».

Si vous prenez votre chien dans les bras dès qu’un chien arrive vers lui, il comprendra : « tous les chiens qui arrivent vers moi sont un danger ». Ce faisant, vous avez de grande chance que votre chien n’acquiert pas les codes d’une bonne socialisation inter espèce.

Exemple de renforcement positif à la suite d’un comportement recherché.

Reprenons l’exemple de votre repas : si votre chien se met dans son panier lorsque vous êtes en train de manger et qu’à la fin de votre repas vous lui apportez une friandise, il a toutes les chances de vous laisser manger tranquillement car il saura qu’une fois que vous aurez fini, il aura droit à une récompense.

En balade, si votre chien se réfugie dans vos jambes mais que vous l’ignorez, il pourra de lui-même aller explorer son environnement et découvrir qu’il peut s’amuser sans crainte. Il fera donc une association d’autant plus positive s’il passe un bon moment à jouer avec un copain.

S’il revient au rappel et que vous le récompensez, il reviendra d’autant plus facilement les fois prochaines.

Le Renforcement Négatif est un stimulus aversif qui disparaît lorsque l’animal parvient à l’éviter ou s’en échapper

Le stimulus aversif doit être approprié du point de vue qualitatif, quantitatif et sur le plan du délai. Il peut être primaire, c’est à dire aversif d’emblée, ou secondaire, c’est à dire devenu aversif par apprentissage.

Exemple de renforcement négatif provoquant une réponse d’évitement :

Si on ajoute un ingrédient amer aux aliments qu’un chien a tendance à manger en balade ou à voler à la maison, le goût désagréable constituera un stimulus aversif primaire, qui engendrera l’évitement.

Si un chien a la fâcheuse tendance à manger le pain mis pour les oiseaux (soit dit en passant il faudrait arrêter car le pain n’est pas top pour les volatiles, mais ce n’est pas le sujet…). Si vous lui préparez des « pièges » en badigeonnant des morceaux de pain avec par exemple de la pierre d’alun réduite en poudre est humidifiée, le gout amer de la pierre d’alun rendra le morceau de pain moins agréable à manger. Cela marchera d’autant mieux si le morceau est suffisamment gros pour qu’il soit obligé de le macher. Ainsi, par apprentissage le chien pourra éviter de manger les bouts pain qu’il trouvera en se rappelant que leur gout était désagréable. Le pain deviendra un stimulus aversif secondaire.

En revanche si le pain trouvé était un sandwich et qu’il sent encore la viande, cette odeur attrayante prendra surement le pas sur la crainte d’avoir un gout amer en gueule…

Si le chat effectue des griffades sur des endroits non permis, il est possible d’asperger de l’eau vinaigrée qui constitue de par l’odeur désagréable, un stimulus aversif primaire, le chat aura ainsi tendance à éviter ces endroits. Si l’on mélange au vinaigre de l’eau de Cologne qui à la base n’est pas un stimulus aversif, par apprentissage l’eau de Cologne même sans vinaigre deviendra un stimulus aversif secondaire, il associera la présence de vinaigre à celle de l’eau de Cologne.

Bref ! vous avez compris le principe. Sinon, contactez-moi.

Exemple de renforcement négatif provoquant une réponse d’échappement :

Si votre chien a tendance à tirer sur sa laisse en balade, en vous arrêtant, il va se retrouver en bout de laisse ce qui créera une tension sur le cou. Pour y échapper il va s’assoir et attendre ce qui va détendre un peu la laisse ou avec un peu de chance revenir spontanément vers vous.

Dans le cas d’un renforcement négatif : l’animal doit avoir la possibilité de produire une réponse lui permettant de se soustraire ou d’éviter un stimulus aversif.

Dans le cas contraire (collier électrique par exemple), la détresse acquise peut s’installer.

La Punition Positive est un stimulus aversif survenant en réponse à un comportement inapproprié

Une punition positive inadaptée (disproportionnée, trop longue, violente, dissociée dans le temps du comportement… ) ne présente pas d’apprentissage, elle appauvrit le répertoire comportemental en supprimant un élément sans le remplacer par un autre.

De plus la punition est plus efficace sur les réponses qui se produisent fréquemment et, inversement, moins efficace sur les réponses dont la fréquence est irrégulière.

Lorsqu’un chien a tendance à sauter sur les personnes, la punition positive peut être :

• A la voix avec un « NON » ferme
• S’il est en laisse ou en longe, associer ce Non à une saccade (adaptée au gabarit du chien)
• Anticiper en mettant le pied sur la longe ou la laisse pour l’empêcher de sauter en disant « NON ».
• Si c’est un grand chien : mettre le genou ou le pied en avant pour l’empêcher de s’approcher, en disant NON.

Il est important que l’animal associe le NON à la sentence : si malgré le NON il essaie de sauter il se trouvera empêché par la tension de la laisse sur le collier ou par un obstacle.

administration d’un stimulus aversif par une personne doit être stoppé dès que le chien émet un signal d’apaisement (voir l’article sur les signaux d’apaisement). L’éthogramme du chien lui apprend que s’il produit une telle attitude, l’interaction désagréable doit s’arrêter. Ne pas en tenir compte est une source d’anxiété pour le chien, voire de réaction agressive (par peur ou irritation).

Pour empêcher un chat de monter sur la table du salon, il est possible de lui dire NON et de l’associer à un pschitt d’eau dans sa direction. Dans la majorité des cas l’eau est un stimulus aversif primaire, associé à l’effet de surprise.

La punition doit être administrée chaque fois que la réponse est produite et sans délai :

Un chien qui saute sur les visiteurs doit être repris systématiquement et par toutes les personnes concernées. S’il n’est réprimandé que lorsque vous ne voulez pas qu’il vous salisse et que vous le laissez faire lorsque vous êtes en balade, ou si cela n’est fait que par les adultes et pas les enfants, la punition ne sera pas efficace.

Si le comportement à éliminer est précédé de plusieurs attitudes successives, il est possible, avant de punir, d’anticiper son comportement et d’agir dès la première des unités constituant la séquence comportementale :

Reprenons l’exemple du chien très excité qui par jeu veut sauter sur tous les humains. A l’approche d’une personne, il peut aboyer, tirer sur la laisse, sauter sur vous, tourner sur lui-même…. il faut anticiper en lui donnant par exemple des consignes de base (assis, coucher, pas bouger, tu laisses..), le détourner (avec un jouet, changer de direction…) avant qu’il ne soit trop excité pour vous entendre et que ne soyez contraint de le punir.

Il faut que le stimulus aversif soit bien associé à la réponse à supprimer. L’animal ne doit pas relier le stimulus à une personne précise, à un endroit ou à une situation particulière : sinon il évitera ces situations ou évitera de répondre dans ces circonstances.

Si votre chien ne répond pas au premier rappel, si lorsqu’il fini par revenir il se fait gronder, il réfléchira à deux fois avant de revenir vers vous. Cela peut être frustrant si l’on passe un certain temps à s’égosiller mais il faut au contraire renforcer positivement le fait qu’il ait choisi de revenir (voir les conflits de motivation).

Si votre chat vous voit utiliser le vaporisateur d’eau, il risque de vous associer à ce stimulus aversif. Il doit en revanche faire le lien entre le NON et le pshitt d’eau.
Pour empêcher un chien de voler les objets se trouvant sur les meubles, à l’instar du vaporisateur d’eau, la punition peut être réalisée à distance : attacher l’objet à une canette remplie de gravillons qui au moment de la chute surprendra le chien. Celui-ci associera alors le vol de l’objet à un bruit désagréable. Il faut que la corde soit suffisamment longue pour que l’objet ne lui tombe pas sur la tête !

L’association négative humain = punition risque de s’établir d’autant plus facilement que l’humain est en colère lorsqu’il punit.

C’est le cas lorsque le chien têtu ne revient pas assez vite et qu’il se prend une avoinée, ou le chat qui vous fuira dès que vous utiliserai un vaporisateur.

Un chien présentant de l’anxiété de séparation fait de la destruction pendant l’absence de son maître. S’il est systématiquement puni au retour de celui-ci, il associe la punition au retour du maître. Il adopte donc une attitude de soumission destinée à apaiser son humain. Ce dernier interprète habituellement cette attitude comme une preuve de culpabilité et affirme : « Il sait très bien qu’il a mal fait !».

Les preuves expérimentales actuelles suggèrent que les chiens montrent ces comportements de « regard coupable » en réponse à l’attitude de leurs propriétaires. Nos chiens et chats sont doués d’intelligence et de sensibilité, mais contrairement aux primates, il n’a pas été démontré qu’ils étaient capables d’éprouver de la culpabilité.

  • La punition n’est efficace que si l’animal est pris en flagrant délit.
  • L’utilisation inconsidéré de la punition peut installer une détresse acquise si l’animal ne peut pas s’y soustraire. (voir l’article La détresse acquise chez les animaux)
  • Il est indispensable de donner à l’animal la possibilité de produire un autre comportement à la place de celui qu’on veut faire disparaître et de renforcer le comportement souhaité.

La Punition Négative est une situation stimulante qui devient inaccessible en réponse à un comportement non désiré

La disparition de l’élément agréable peut se présenter sous plusieurs formes en fonction des problématiques :

  • retirer les stimuli appétitifs (friandises, jouets…)
  • l’ignorer ou changer de pièce tant qu’il n’est pas calmé,
  • empêcher l’animal d’effectuer une activité renforçant le comportement indésiré (mettre le chien en laisse, lui demander de s’assoir ou se coucher)
  • déplacer l’animal pendant un temps limité (2 à 3 min max) d’un environnement riche en stimuli (le salon, le jardin..) vers un autre lieu qui en est dépourvu (ex la salle de bain). Cette punition par isolement s’appelle le « time-out ».

La durée du time-out ne doit pas être trop longue pour que l’animal puisse être à    nouveau confronté aux stimuli qui provoquent la réponse à supprimer et qu’il ait ainsi la possibilité d’apprendre une réponse différente. Si la réponse à supprimer survient à nouveau, il est renvoyé au calme, pour la même durée que précédemment.

Résumé sur les punitions et les renforcements avec l’exemple de la marche en laisse

Pour illustrer l’éducation positive j’ai indiqué en vert les attitudes à privilégier, en orange celles à utiliser avec le bon dosage (pression sur la laisse) et en rouge celles qu’il faudrait éviter.

Conclusion sur les renforcements et les punitions

Le dressage et l’éducation à l’ancienne, se basent sur la crainte exercée, la notion de domination / soumission, la contrainte physique et psychologique.

Par opposition, l’éducation positive se fonde sur l’encouragement à répéter les bons comportements et ignorer les mauvais.

Beaucoup de personnes considèrent par anthropomorphisme la punition positive comme le traitement le plus facile et le plus logique. Cependant les exigences à respecter lors de la mise en œuvre en montrent les limites.

Il est désormais prouvé que les contraintes physiques et mentales inadaptées, violentes voire douloureuses, peuvent laisser des traces visibles (blessures, problèmes de motricité, maladies de peau..) mais également psychologiques (troubles du comportement : anxiété, dépression, malpropreté, destruction, agressivité… ).

L’application systématique des punitions positives pour chaque « mauvais » comportement, aura pour effet que l’animal fera avant tout l’association entre punition et présence de l’humain qui punit.

Pour lui, la punition ne sera pas liée à un comportement indésirable, mais avec le fait que vous soyez là… C’est un peu moyen pour créer du lien non ?

Les notions de valeur et de conflits de motivation rentrent également en ligne de compte :

L’animal va très vite comprendre qu’en votre présence, il faut se tenir à carreau, mais désobéira dès que vous serez absent puisqu’il n’y aura pas eu d’apprentissage pour remplacer le comportement gênant.

Ainsi, la valeur de crainte que votre présence lui inspire ne fonctionnera plus en votre absence.

Cela étant dit, ma chienne Heidie, continue, à dépouiller la poubelle lorsque j’ai le dos tourné.

Je ne peux rien faire puisqu’elle ne le fait que lorsque je ne suis pas présente, aussi c’est à moi de comprendre que je ne peux pas laisser la poubelle accessible, car le conflit de motivation sera trop fort pour résister.

En éducation positive, il faut faire preuve d’imagination pour que les renforcements varient et pour éviter que l’animal ne se lasse trop vite des récompenses, d’où la notion de valeur appétitive.

L’éducation positive ne veut pas dire, tout laisser faire ou faire des compromis au dépend d’un protagoniste (humain ou animal). Il est indispensable de trouver le point d’équilibre entre l’obtention de comportements appropriés et l’assouvissement de ses besoins naturels.

Si votre chien aime creuser : pour lui éviter de faire de votre jardin un champ de mine, réservez-lui un endroit où il pourra s’adonner à cette activité comme un bac à sable dans lequel vous aurez caché ses jouets favoris.

En éducation positive le fait de mettre l’accent sur les bons comportements en valorisant ce qui est « bien fait », encourage leur réapparition. La qualité du lien qui unit l’humain et l’animal rend ce dernier plus enclin à contribuer à ce bon fonctionnement et va participer activement à la pérennisation de cette relation.

Diamétralement opposée aux méthodes employant exclusivement les punitions positives pour abolir les comportements indésirables, la méthode du renforcement positif est beaucoup plus efficace à long terme mais demande un peu plus de rigueur et de patience.

Le comprendre, c’est l’aimer !