Aller au contenu
Rechercher dans
  • Plus d’options…
Rechercher les résultats qui contiennent…
Rechercher les résultats dans…
Aline42

Le conditionnement et l’apprentissage

Messages recommandés

Le conditionnement est un processus qui concerne les rapports entre les stimuli et les réponses de l’individu. Il représente une autre forme d’apprentissage appelé associatif. On distingue deux formes particulières de conditionnement qui, en réalité, sont intimement liées, le conditionnement classique de type Pavlovien et le conditionnement opérant dénommé également instrumental ou Skinnerien.


CONDITIONNEMENT CLASSIQUE

Les expériences de Pavlov en 1904 sont célèbres. Dans un premier temps, un stimulus inconditionnel (SI), l’administration de poudre de viande, aboutit à une réponse de salivation inconditionnelle (RI). Dans un deuxième temps, un stimulus neutre à l’origine (SN), le son d’une cloche, devient conditionnel (SC) quand on l’associe de façon répétitive préalablement au stimulus inconditionnel, car il entraîne une réponse conditionnelle (RC), la salivation. Le chien apprend que le premier stimulus annonce le second et exprime la même réponse aux deux stimuli. Ils ont été associés par le chien. C’est le modèle du conditionnement classique. De nombreux exemples quotidiens peuvent décrire cette forme simple de réponses. Un chien qui saute quand le maître prend sa laisse a associé celle-ci à la balade ; un chat qui file vers sa gamelle quand vous entrez dans la cuisine sait qu’il aura à manger sous peu. Ces animaux ont appris à relier deux stimuli qui, pris séparément, n’avaient jusque-là aucune relation.


CONDITIONNEMENT OPÉRANT

Les exemples précédents ne font apparemment intervenir que des réflexes simples, mais en y regardant de plus près on s’aperçoit que le chien et le chat ne se contentent pas d’associer deux stimuli, mais qu’ils tiennent compte également des conséquences de leurs actes. Ainsi, le chien sent qu’il peut avoir une influence sur le comportement de son maître en bondissant à la vue de la laisse, il tente de faire accélérer le moment de la sortie ; de même, le chat, en miaulant, sait qu’il peut augmenter la rapidité de la délivrance de son repas. Ils ont appris qu’ils peuvent agir sur leur environnement Cette forme de conditionnement concerne donc l’apprentissage d’une relation entre, d’une part, un stimulus et sa réponse, et d’autre part, une réponse et sa conséquence. On comprend ici que le stimulus n’est pas l’élément invariable et statique qui force l’individu à réagir. Il est perçu en réalité comme tout élément de la situation dans laquelle une réponse est émise et renforcée. Le stimulus peut alors acquérir une fonction de contrôle sur la réponse. Cette fonction se marquera par le fait que le débit de la réponse augmentera ou diminuera en sa présence.

C’est Skinner, célèbre béhavioriste américain, qui, le premier, définit ce processus sous le terme de conditionnement opérant (ou instrumental) grâce à ses expériences sur des rongeurs de laboratoire, en les faisant manipuler des leviers ou arpenter des labyrinthes pour obtenir de la nourriture. Ces animaux apprirent vite où était leur intérêt dans les différentes solutions qui leur étaient proposées. Le conditionnement opérant était né. Cette forme particulière d’apprentissage obéit à une loi immuable qui sonne comme une lapalissade : « Un comportement, qui dans une situation donnée, produit de la satisfaction, a plus de chances de se reproduire si une situation identique survient à nouveau. À l’inverse, un comportement ayant entraîné de l’insatisfaction dans une situation déterminée aura tendance à disparaître si cette situation se représente ultérieurement ".

Dans le conditionnement opérant, deux réactions contraires sont impliquées : la discrimination et la généralisation. La discrimination est la faculté, pour l’animal, de choisir entre deux signaux émis, alors qu’à l’inverse, la généralisation ne lui permet pas de le faire. Ainsi, le nom du chien que l’on appelle est différent à ses oreilles de tous les autres mots prononcés par son maître, il y a eu discrimination. À l’inverse un chiot, nouvellement acquis, reviendra vers son maître quel que soit le mot prononcé. Il y a alors généralisation. On utilise ces capacités à généraliser et à discriminer, dans l’éducation, dans l’obéissance et dans le traitement des situations comportementales problématiques.

Les stimuli qui contrôlent les réponses sont nommés discriminatifs dans le langage du conditionnement opérant et conditionnels dans le langage du conditionnement classique. Le stimulus discriminatif n’agit pas comme un simple déclencheur de comportement. Il ne représente qu’un des aspects, souvent crucial, des circonstances dans lesquelles une réponse est émise et renforcée La règle principale qui régit l’action des stimuli discriminatifs sur les comportements peut s’énoncer de la manière suivante : la fréquence d’un comportement opérant sera élevée en présence d’un stimulus discriminatif qui dans le passé a accompagné la production de ce comportement et a signalé son renforcement

Tous les stimuli n’ont pas la même valeur pour un animal donné. Lorsqu’on a appris à un chien à s’asseoir en tirant sur la laisse et avec une commande verbale assis, il ne répondra pas de la même manière aux deux stimuli, l’un étant plus fort que l’autre. C’est une des raisons pour lesquelles la commande verbale seule ne suffit pas, en général, à faire asseoir le chien.

En résumé, si l’apprentissage classique concerne les relations entre un stimulus et une réponse, celui par conditionnement opérant s’intéresse aux conséquences de cette réponse et dans toutes les situations ces deux formes d’apprentissage (conditionnements classique et opérant) coexisteront.


LA PRÉDICTIBILITÉ DANS LE CONDITIONNEMENT

C’est la possibilité, pour l’animal, de prévoir le stimulus inconditionnel. Plus elle sera grande, plus l’association entre les deux stimuli se fera aisément. Elle dépend :

(a) De la chronologie. Le stimulus conditionnel doit apparaître peu de temps avant le stimulus inconditionnel

(b) De la nouveauté (l’originalité). L’association entre deux stimuli se réalisera d’autant plus difficilement que le stimulus conditionnel est déjà bien connu de l’animal.

(c) Du caractère systématique. Lorsque les relations entre stimuli conditionnel et inconditionnel sont irrégulières et lorsque le premier n’est pas toujours suivi du second, l’apprentissage se fera d’autant plus difficilement

(d) De l’intensité. Un stimulus de trop faible intensité sera peu perçu par l’animal et l’apprentissage sera d’autant plus difficile.

Prenons un exemple : La clé dans la serrure est le stimulus conditionnel prédictif de l’arrivée des maîtres (stimulus inconditionnel), le chien manifeste sa satisfaction (réponse conditionnelle) derrière la porte d’entrée. Si le bruit des clés ne suit pas rapidement l’entrée des maîtres (mauvaise chronologie), si le chien a déjà entendu le bruit de clés auparavant, dans un chenil par exemple (manque de nouveauté), si d’autres personnes rentrent de la même façon dans la maison, la femme de ménage par exemple (absence de caractère systématique), si le bruit des clés est couvert par un autre bruit (intensité faible), la réponse du chien sera plus aléatoire et le conditionnement plus difficile.

REMARQUE : CONDITIONNEMENTS HÉRÉTIQUES

Certains animaux sont non-intentionnellement conditionnés par des renforcements non concomitants (sans rapport direct visible) de leurs comportements et présentent alors des attitudes aberrantes ou incompréhensibles. On veillera à ne pas mal interpréter ces comportements qui peuvent évoquer à tort un processus cognitif élaboré. Les conditionnements hérétiques se rencontrent également chez les animaux qui ne peuvent se soustraire à des présentations renouvelées d’un stimulus aversif : on parlera alors de détresse acquise, comme par exemple chez ces animaux phobiques du tonnerre qui ne peuvent s’en libérer.


RENFORCEMENTS ET PUNITIONS

Dans l’apprentissage par conditionnement opérant, quatre formes différentes de relation existent entre la réponse comportementale et ses conséquences : deux ayant tendance à augmenter l’apparition de la réponse (les renforcements) et deux autres, au contraire, à diminuer voire supprimer cette réponse (les punitions).

A - LES RENFORCEMENTS

Un renforcement est un processus qui implique un stimulus ou un événement ayant tendance à augmenter l’apparition ou l’intensité d’une réponse comportementale. La satisfaction, conséquence du comportement effectué, est l’élément moteur du renforcement. Celui-ci peut être positif ou négatif.

Renforcement positif ou récompense : Lorsque l’on délivre de la nourriture à un chien qui aboie pour l’obtenir, on le conforte dans ce comportement La nourriture est le renforcement positif aux aboiements. Un renforcement positif est donc une récompense. Il existe des renforcements positifs primaires dont le stimulus a une valeur essentielle pour l’animal : la nourriture bien sûr, le jeu, les relations sociales (contacts, caresses, attentions, compliments), les mâchonnements, la suppression de l’inconfort et des renforcements positifs secondaires, dont le stimulus n’a, au départ, aucune signification pour l’animal, mais qui, associé à un stimulus essentiel, en prend le sens et la fonction. Il peut s’agir d’objets divers, de bruits également. Un chien qui revient quand on le siffle a associé le sifflement à une récompense (renforcement positif primaire) si, quand il revient, il obtient caresses ou friandises. Le sifflement devient alors le stimulus du renforcement positif secondaire.

On notera que la plupart des comportements, même apparaissant sporadiquement, peuvent être intensifiés par un renforcement positif, mais à l’inverse qu’une attitude ne pourra pas l’être. On récompensera ainsi un chien qui s’assoit, mais non un chien qui est assis. On notera également que supprimer un renforcement tend à faire disparaître le comportement qui y est associé, c’est le premier objectif que l’on se fixera quand on voudra éliminer un comportement indésirable : on parlera alors d’extinction du comportement. Remarquons que, dans un premier temps, le comportement s’aggrave ou s’amplifie lorsqu’on « lui » supprime son renforcement. Quelques conditions régissent ce type d’apprentissage. Un renforcement positif n’a pas de valeur absolue. La pluie est un renforcement positif pour les canards et négatif chez la plupart des chats ! Si l’on veut apprendre un nouveau comportement à un chien, il faudra l’associer à un renforcement positif systématique, c’est-à-dire à chaque fois. Toutes les bonnes réponses sont alors récompensées et l’on parlera de renforcement continu.

Du bon usage de la récompense La récompense est une information donnée au chien. On ne récompense pas un animal, on récompense un comportement ! Pour apprendre un nouveau comportement au chien, on récompense, on renforce ce comportement systématiquement, à chaque fois (renforcement continu).

Partager ce message


Lien à poster
Partager sur d’autres sites
suite:

Le timing (chronologie) est essentiel : les récompenses doivent être délivrées après lé comportement désiré, dans les quelques secondes qui suivent, afin d’être associées, par l’animal, au comportement qu’il vient d’effectuer. La récompense doit être stimulante et adaptée, à l’animal. Un morceau de fromage sera plus intéressant qu’une croquette. Un animal sera davantage stimulé par la nourriture s’il est à jeun. La taille de la récompense alimentaire ne joue aucun rôle sur la stimulation qu’elle engendre. Dans le cas d’un animal peu intéressé par la nourriture, il conviendra d’user d’autres stratagèmes comme le jeu ou la sortie en promenade, en utilisant des objets (laisse, collier) qui s’y rapportent (renforcements secondaires). La récompense ne doit pas rendre le chien trop excité. Pour maintenir un comportement appris, on utilisera le renforcement par intermittence plutôt que continu. Pour maintenir un comportement acquis, on ne renforcera qu’une partie des bonnes réponses : on parlera de renforcement intermittent. Le comportement qui en découle sera plus résistant à l’extinction que celui apparu en renforcement continu.

Dans un renforcement intermittent, on pourra récompenser suivant un programme établi (1 bonne réponse sur deux, ou une sur trois etc. ’ou toutes les trois, quatre, cinq secondes, etc.) ou à l’inverse d’une manière anarchique afin que l’animal ne puisse pas prévoir le moment de la récompense. Un comportement appris suivant un programme de renforcement anarchique est plus difficile à supprimer.

Prenons l’exemple du chien qui aboie pour obtenir une friandise alors que ses maîtres sont attablés. Ce chien a appris à aboyer car on lui a délivré une récompense alimentaire systématique au départ. Il a ensuite été renforcé d’une manière anarchique, non prévisible pour lui ; il aboyait 2 fois il avait sa friandise, puis ce n’est qu’au bout de la cinquième fois, puis immédiatement après l’aboiement suivant, etc... Dans un cas comme celui-ci il sera difficile de supprimer les aboiements en supprimant simplement leur renforcement (nourriture), le comportement étant très stable.

Etude d’un exemple d’apprentissage par renforcement positif secondaire : le clicker-training ou apprentissage par le clicker.

Le clicker training est une méthode d’éducation animale qui fait appel à un petit appareil de 5 cm sur 2,5 que l’on nomme clicker. Il est constitué d’un boîtier en plastique dans lequel se loge une lame d’acier. Une pression d’un doigt sur la lame émet un son net, sec, toujours identique et parfaitement audible. Karen Pryor, comportementaliste américaine, utilisait au départ le clicker pour dresser les dauphins. Elle eut l’idée d’appliquer cette méthode aux animaux domestiques et y trouva là un moyen efficace d’éducation et de gestion de certains problèmes comportementaux. Le principe du clicker training est d’utiliser le bruit du clicker comme renforcement positif secondaire.

Comment l’utiliser ? Dans un premier temps, on conditionne l’animal au bruit du clicker. Rappelons que l’on peut appliquer cette forme particulière d’éducation à n’importe quel animal domestique, nous ne parlerons ici que des chiens. Le conditionnement se fait en général rapidement. On clique et on délivre une friandise, on clique et on délivre une friandise ; on répète cette séquence plusieurs fois. Le chien comprend rapidement que le bruit du clicker est suivi de l’obtention d’un aliment. Le clicker joue alors le rôle de renforcement positif secondaire car il n’a pas de valeur initiale pour l’animal, mais associé à un renforcement primaire (nourriture), il en prendra toutes ses qualités.

Une fois que le chien est conditionné par le bruit du clicker, la délivrance de nourriture peut très bien être différée.

Dans cette méthode, on appliquera les règles générales des renforcements positifs. On émettra le son du clicker chaque fois que le comportement de l’animal correspondra à ce que l’on attend de lui. Il n’est pas là pour appeler le chien, le faire réagir au bruit, le distraire ou même le faire arrêter dans ce qu’il fait. Il signifie pour l’animal : « C’est bien ce que tu fais là ". On verra alors le chien rechercher le comportement à effectuer pour obtenir le bruit.

Pourquoi utiliser l’apprentissage par le clicker ? Par rapport à la délivrance de nourriture, aux caresses ou aux compliments, il est plus rapide, plus précis, plus constant. On peut également l’utiliser à distance. Avec le clicker training de nombreux comportements peuvent être appris (ouvrir une porte, chercher le journal, faire une roulade...) par petites étapes successives renforcées les unes après les autres (le « shaping »). Apprendre de tels comportements peut sembler anecdotique et du registre du pur dressage. Il n’en est rien. Même si elle nécessite une bonne compréhension des principes de base des apprentissages et une patience constante, la méthode du clicker training est une méthode d’éducation et d’apprentissage qui a l’avantage de motiver le propriétaire, d’être simple et performante. Elle permet, grâce au renforcement positif, de découvrir l’animal d’une façon différente et ainsi de changer les relations maîtres chien, objectif souvent essentiel pour le vétérinaire, dans le traitement des troubles du comportement.

Renforcement négatif : Un renforcement négatif est un processus impliquant un stimulus désagréable, qualifié d’aversif, qui disparaît (ou n’apparaît pas) suite à une réponse et qui augmente la probabilité de réapparition ou l’intensité de cette réponse. Le sujet tend à se soustraire au stimulus ou à l’empêcher d’apparaître. On appuie sur la croupe et on tire sur le collier d’un chien pour lui apprendre à s’asseoir. L’animal exécutera ce comportement pour supprimer ces stimuli aversifs ; on peut dire, alors, qu’il a appris à s’asseoir par renforcement négatif. Le renforcement négatif n’est pas une punition même si ces deux notions sont souvent confondues. En effet, comme nous le verrons, la punition apparaît après le comportement sur lequel elle doit agir et, contrairement au renforcement négatif, elle a tendance à diminuer la probabilité d’apparition de ce comportement. Les caractéristiques générales du renforcement négatif sont les mêmes que celles qui intéressent le renforcement positif.

REMARQUE : Lorsqu’un comportement a été renforcé une première fois, ses propriétés ne seront pas obligatoirement les mêmes lors d’un prochain renforcement, le renforcement agissant sur certains facteurs de la réponse. Il ne sera donc pas toujours facile de cerner les propriétés de la réponse dont dépend le renforcement. Ainsi la probabilité d’apparition d’une réponse est fonction de l’intensité nécessaire à la provoquer, de la rapidité d’acquisition de cette réponse et du temps nécessaire à sou extinction.

B - LES PUNITIONS Une punition est un processus qui implique un stimulus ou la création d’une situation intervenant au moment de l’exécution d’un comportement (ou après) et ayant tendance à diminuer la probabilité d’apparition ou l’intensité de ce comportement. Elle, aussi, peut être positive ou négative. l1insatisfaction, conséquence du comportement effectué, est l’élément moteur de la punition.

La punition positive : Elle fait appel à un stimulus aversif. Nous l’utilisons tous, elle consiste à donner un coup sec sur la laisse pour que le chien arrête de tirer ou elle s’exprime par un « NON ! » retentissant quand notre compagnon préféré a le nez dans la poubelle. Nous avons là deux stimuli avers ifs qui devraient diminuer la probabilité d’apparition du comportement indésirable. La punition positive est également régie par des règles et des caractéristiques précises.

Du bon usage de la punition positive La punition, comme l’était la récompense, est une information donnée à l’animal. Là aussi, on ne punit pas l’animal mais le comportement indésirable. Le timing est, encore, ici primordial. La punition doit être concomitante du comportement à supprimer, c’est-à-dire être appliquée au moment où ce comportement a lieu (ou juste après) « l’animal doit être pris sur le fait ». L’intensité du stimulus aversif doit être suffisamment élevée pour être considérée par le chien comme réellement désagréable, sans, bien sûr, le mettre en danger. Le niveau initial de la punition doit être d’emblée élevé. L’apparition du stimulus aversif doit être brutale. La punition doit être systématique, la probabilité de suppression du comportement n’en sera que plus grande. Plus la motivation de l’animal est grande à effectuer un certain comportement, moins la punition seule aura d’effet. Dans ce cas-là, il vaut mieux toujours essayer de diminuer la motivation d’abord avant de punir et cette punition sera d’autant plus efficace qu’on l’accompagnera d’un comportement alternatif récompensé. Ainsi on veut supprimer, chez un chien, cette désagréable habitude de sauter sur les visiteurs. Au moment de l’entrée des invités on corrigera le chien en le frappant avec un objet non blessant (une serviette de toilette enroulée sur elle-même, par exemple) ce qui aura tendance à faire arrêter ce comportement. Si la motivation de l’animal est trop importante, on demandera aux maîtres de sonner eux aussi avant d’entrer (diminution de la motivation) et on apprendra au chien à s’asseoir méthodiquement en le récompensant d’une friandise (comportement alternatif) l’efficacité de la punition en sera augmentée.

La punition négative : L’apprentissage par la punition négative, consiste à faire disparaître un stimulus agréable au chien, dit « appétitif », pour diminuer le comportement indésirable. Ainsi, lorsqu’un chiot mordille les mains on les enlèvera systématiquement dès que l’animal vient les renifler et commence à les mordiller. De même en demandant aux visiteurs de se présenter dos au chien, on pourra supprimer la mauvaise habitude de sauter, par la suppression du stimulus agréable (accueil de face).

C - L’APPRENTISSAGE LATENT

Cette forme d’apprentissage apparaît sans la présence de renforcement. C’est l’association de plusieurs stimuli qui va être mémorisée et qui servira ultérieurement. Il facilite l’acquisition rapide d’une réponse ultérieure lorsqu’il y aura renforcement. Un chien ayant, à plusieurs reprises, effectué un parcours d’agility mettra moins de temps à l’achever qu’un autre qui le découvre. Il en va de même pour des rats qui ont eu la connaissance du parcours d’un labyrinthe et qui, lors d’un prochain essai, iront recueillir la récompense plus rapidement que ceux qui ne l’ont jamais visité.

D - L’APPRENTISSAGE PAR IMITATION ET PAR OBSERVATION

C’est la façon qu’a un individu d’apprendre un comportement en le calquant sur celui d’un autre. Les stimuli ne provoquent le comportement que sur l’individu qui est copié. Lorsque les deux comportements sont identiques, on parlera d’apprentissage par imitation et lorsque le copieur effectuera un comportement voisin mais modifié par rapport à celui du copié, on parlera d’apprentissage par observation.

L’apprentissage par imitation est classiquement utilisé, par exemple, chez les chiens de troupeaux qui ont du mal à déclarer leur aptitude au travail et chez lesquels on favorise ce type d’apprentissage au contact de chiens plus expérimentés.

E - L’APPRENTISSAGE PAR « INSIGHT » OU PAR INTUITION OU PAR COMPRÉHENSION SOUDAINE

C’est l’apprentissage immédiat par raisonnement ou la faculté, chez un individu, d’associer plusieurs expériences pour résoudre un problème, sans y avoir pourtant jamais été confronté. I’expérience qui a servi de base aux gestaltistes (psychologues de la forme) pour étudier cet apprentissage particulier a consisté à observer un chimpanzé (Pan troglodytes) empiler des caisses pour atteindre une banane accrochée au plafond de sa cage ! Chez les mammifères, cette forme particulière d’apprentissage n’a été démontrée que chez les vertébrés supérieurs. Il n’a jamais été prouvé qu’un chien pouvait apprendre par compréhension soudaine !

F - CHOISIR SON APPRENTISSAGE

Tout en gardant à l’esprit que, dans la plupart des cas, plusieurs événements concourent conjointement à l’apparition et au maintien des comportements, il est légitime de se demander quelle est la meilleure méthode d’apprentissage dans l’éducation et l’obéissance, chez le chien. Pour simplifier il existe deux grandes formes d’apprentissage : celle où l’animal est confronté à une situation désagréable (punition positive et renforcement négatif) que nous appellerons techniques aversives d’apprentissage et celle où l’animal apprend dans un contexte qui ne peut engendrer ni peur ni anxiété et que l’on pourrait nommer techniques non aversives : c’est le cas bien sûr de la récompense (renforcement positif) mais aussi de la punition négative. Il n’existe pas de méthode parfaitement sûre à employer chez tous les animaux et dans tous les cas. Nous ne le répéterons jamais assez, chaque individu est unique et ne réagit donc pas de la même manière aux différentes techniques d’apprentissage.

Cependant certaines grandes règles doivent être prises en compte.
La première est que les apprentissages par les techniques non aversives (renforcements positif ou punition négative) même mal exécutés, ne peuvent pas, à eux seuls, engendrer ou aggraver des troubles comportementaux, déjà présents. On pourra donc les conseiller à tous nos clients pour leurs chiots et leurs chiens adultes en insistant sur la bonne mise en place de ces méthodes et mieux encore en proposant d’alterner habilement les techniques de renforcement positif et de punition négative, en minimisant le rôle des méthodes aversives.
La deuxième est que la punition, méthode la plus utilisée par les propriétaires d’animaux est inefficace, voire dangereuse lorsque mal employée. Il faudra donc impérativement insister sur la manière de bien appliquer cette méthode, la contrôler régulièrement et bien connaître les animaux sur lesquels elle est utilisée. Les méthodes dites aversives peuvent être utiles dans les problèmes comportementaux indésirables mineurs et uniquement sur des animaux qui ne peuvent pas représenter un danger pour leurs maîtres ou sur lesquels ont risquerait de voir apparaître un comportement de peur ou d’anxiété.
Dans les autres cas, on utilisera uniquement les méthodes non aversives que ce soi pour corriger des comportements aberrants ou traiter des pathologies profondes.

Partager ce message


Lien à poster
Partager sur d’autres sites

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant

×
×
  • Créer...