Le renforcement positif Procédure d’apprentissage
Note de Recherches : Le renforcement positif Procédure d’apprentissage. Recherche parmi 300 000+ dissertationsPar majid2719 • 27 Novembre 2012 • 525 Mots (3 Pages) • 1 007 Vues
Le renforcement positif Procédure d’apprentissage, d’abord décrit par I. Pavolov dès 1902, dans laquelle un stimulus dit conditionné (par ex. sonnerie) associé avec un stimulus inconditionnel (nourriture) provoque une réponse conditionné similaire à la réponse inconditionnelle (salivation).
Mécanisme d’apprentissage associatif mis en évidence par cette procédure. Le terme a été ensuite appliqué à une procédure sensiblement différente, dans la quelle un comportement, tel le parcours d’un labyrinthe ou l’ouverture d’une porte (boîte à problème) est sanctionné par un renforcement alimentaire : on parle alors de conditionnement, ou plus couramment d’apprentissage instrumental. B.F.Skinner en 1938 a épuré cette dernière procédure en mettant au point un dispositif où l’animal actionne un levier-réponse et reçoit une ration de nourriture. C’est à cette situation que s’appliquent spécialement les termes conditionnement opérant (instrumental) ou de type II, que Skinner distingue du conditionnement pavlovien (classique) ou de type I.
Les deux types sont clairement distincts au plan des procédures : la réponse (R) est déclenchée par le stimulus conditionné dans le conditionnement pavlovien, elle est émise par le sujet dans le conditionnement opérant. ; la présentation du stimulus inconditionnel (renforcement) dans le conditionnement pavlovien dépend de l’expérimentateur, elle dépend de la réponse du sujet dans le conditionnement opérant.
La réponse d’abord inconditionnelle, puis conditionnelle du conditionnement pavlovien est lié au stimulus inconditionnelle par une liaison permanente, physiologique, alors que la réponse et renforcement de du conditionnement opérant entretien un lien arbitraire
Exemples : Le paradigme expérimental du conditionnement opérant est le suivant :
Un animal affamé est placé dans un cage pourvue de deux mécanismes : un dispositif réponse pouvant être actionné par l’animal et un réceptacle destinée à recevoir une quantité déterminée de nourriture ou de liquide. Sur la base des réponses d’exploration du milieu présentées par l’animal, l’expérimentateur amène progressivement une unité de comportement sous le contrôle du renforcement.
En d’autres termes, la réponse choisie par , l’expérimentateur, actionner le dispositif réponse, est suivi de l’octroi d’un peu de nourriture. On verra ensuite l’animal répéter la réponse dont la probabilité d’apparition atteindra un niveau stable aussi longtemps qu’elle sera suivie d’un renforcement. L’unité de comportement ainsi installe , ou réponse opérante, est fonctionnellement reliée à ses conséquences, ou renforcement.
Dans le paradigme expérimental du conditionnement opérant, il n’existe aucune relation de cause à effet entre la réponse et le renforcement avant le conditionnement.
Dans le conditionnement pavlovien, l’organisme subit la réponse. Dans le conditionnement skinnérien, il agit sur son milieu. En d’autre termes une réponse de type classique ou pavlovien est contrôlée par les événements qui la précèdent ; une réponse de type opérant est contrôlée par ses conséquences.
Utilisation : Les applications du conditionnement :
...