罗伯特·瑞斯科拉:学习的遗产
每个初出茅庐的心理学家都有这样的时刻,他们偶然发现了一个研究领域,激发了一种压倒性的可能性。对我来说,那一刻发生在我被介绍给Robert Rescorla教授的工作时。事实上,从那以后,我对联想学习的热情一直伴随着我,并激发了我自己的许多研究。听到Rescorla在24日去世的消息,我深感悲痛th2020年3月。欣赏Rescorla革命性的学习方法是很重要的,它在Rescorla- wagner(1972)模型中正式概念化。
Rescorla真正的随机控制:
早期的理论主张…的重要性时间接近在联想学习中。这一概念表明,在时间上紧密发生的事件之间形成了关联。1968年,Rescorla进行了他最著名的研究之一——“真正随机控制”程序1.本研究强调了条件刺激(CS)和无条件刺激(US)在学习中的连续性的重要性。US是一种具有正或负效价的刺激,如奖励的食物或惩罚的电击,CS是一种中性效价的刺激,但标志着US的传递。老鼠受到的电击取决于音调的呈现。在一组中,电击只在有音调的情况下发生。在另一组中,在有和没有音调的情况下,电击的概率是相等的。重要的是,两组都有相同数量的音调-冲击配对,但CS和US之间的偶然性有所不同。Rescorla发现,前一组人学会了音调-震动的关系,而后一组人则没有。这些结果强调了CS和美国之间的时间和偶然性的重要性,这样美国就会在联想学习中跟随CS。”
Rescorla-Wagner模型:
Rescorla-Wagner模型彻底改变了心理学家概念化联想学习的方式,其表达式为ΔV = αβ (λ - ΣV)2.“ΔV”指的是每次试验中联想学习的增量。假设CS和US的显著性在试验中是固定的,分别用“α”和“β”表示。“λ”代表美国所能支持的最大联想强度;这被认为对任何美国来说都是固定的,而且与刺激措施的显著性有关。最后,试验中出现的所有CSs的总联想强度由ΣV表示。简单地说,该模型计算预测误差,因此“学习”是预期结果与实际结果之间差异的产物。
在Rescorla-Wagner模型发展之前,联想学习的概念是定性的。了解CS和US之间的关系以前被理解为刺激之间的“心理联系”的形成,更多的学习被认为反映了“更强的联系”。该模型彻底改变了我们对这些“心理联系”的理解,因为它是第一个通过计算建立联想学习模型的模型。这从根本上改变了我们理解联想学习的方法,并为接下来50年的研究奠定了基础。
该模型的壮举:
除了大量其他工作,Rescorla在1968年的研究导致了他在该领域最显著的贡献之一——Rescorla- wagner(1972)模型。该模型成功地解释了文献中的许多经典发现。例如,它为“负加速习得曲线”提供了一种解释,指的是在试验中学习下降的增量现象。Kehoe等人(1994年)证明了这一点,他训练兔子,用音调表示眶休克的交付,准备闭上眼睑是“学习”的衡量标准。3..在整个试验中,眼睑闭合的增量被发现在下降,这与模型的假设是一致的。
Rescorla的模型也为阻挡和遮蔽现象提供了解释。“阻塞”指的是,在先前训练过的CS (CS a)在场的情况下,将CS (CS B)与美国配对,会损害对CS与美国关系的学习4.该模型通过假设CS AB化合物对US的反应是预期的,因为CS A之前已经与US配对。例如,一只啮齿动物可能会被训练成灯光发出食物的信号。在第二阶段,灯光可能会与发出食物外卖信号的音调同时出现。在这种情况下,大鼠将无法了解音调和食物之间的关系,因为由于同时呈现的光线,食物的递送是预期的。因此,光线“阻止”了对音调的学习,因为不存在预测错误。
遮蔽指的是训练动物用两种不同的刺激来发出食物的信号,比如光线和音调。相反,阻断会阻止动物了解这些刺激信号中的一种是食物。
以下是一些新颖的预测:
Rescorla的模型做出了许多违反直觉的预测,其中一些预测得到了后续实验的支持。例如,该模型正确地预测了“超常条件作用”现象。Pearce和Redhead(1995)对此有证据,他们比较了两组大鼠的学习能力6.在第一阶段,超常条件反射组被训练为刺激X表示没有食物。刺激X的作用是一种条件抑制剂,因此它是一种具有负联想强度的CS。在第二阶段,超常条件反射组和对照组均接受复合刺激AX导致食物奖励的训练。在最后一个阶段,研究人员评估了刺激a本身的反应。他们发现,超常条件反射组的大鼠比对照组更了解刺激A和食物之间的关系。该模型通过假设可以发生的最大学习量由λ -决定来解释这一点ΣV。由于条件抑制剂(刺激X)具有负的联想强度,两者之间的差异更大λ和与对照组相比,超常调节组的ΣV,使CS获得更大的联想强度。这些违反直觉的预测的正确性凸显了这个模型的独创性。
尽管Rescorla-Wagner模型取得了成功,但仍留下了许多未解之谜。各种研究得出的数据与模型的假设不一致,随后的模型往往试图解释这种矛盾。下面的讨论将概述该模型的一些缺陷和联想学习理论家所面临的剩余挑战。然而,值得注意的是,这些限制并没有减损该模型概念化联想学习的独创性和革命性方法。
lambda的限制
该模型的关键局限性之一与美国只能支持固定数量的联合力量这一假设有关。反对这一假设的证据来自复合学习效应的证明,包括前面讨论的遮蔽现象7和阻塞8,可以通过大量的训练试验来消除。
此外,该模型不能解释增强作用,指的是在复合CS- us训练中,低显著性CS可以掩盖更显著性CS的现象9.增强作用的证据来自Clarke等人(1979),他告诉鸽子味觉刺激或视觉刺激会导致负面结果10.他们发现,相比于负面结果和视觉刺激之间的关系,鸽子对负面结果和味觉刺激之间的关系了解得更多。与模型的预测相反,作者报告说,不太突出的视觉刺激掩盖了更突出的味觉刺激。
Clarke等人(1979)在鸽子身上比较了视觉刺激和负面结果以及气味刺激和负面结果之间的学习关系。
这一理论得到了实证的支持,即降低较显著的CS与美国之间的联想强度会减弱对较不显著CS的增强反应11.这支持了Durlach和Rescorla(1980)的解释,因为它表明,不太突出的刺激可能仍然会唤起更突出的CS的表现,但由于更突出的CS与美国之间的关联减弱,这不再提升反应。这些对Rescorla-Wagner模型的阐述使它能够解释这些现象。
自发恢复的问题
灭绝后的自发恢复是模型的另一个难点12.这指的是在一段时间后,恢复以前与美国有关,但不再与美国有关的国家。打破CS和美国之间的联系的过程被称为“灭绝”,通常是通过在没有美国的情况下呈现CS来完成的。强烈但中性的提示也可以在消失后恢复对CS的反应13.该模型未能解释这些结果,因为它假设灭绝抵消了对中美关系的任何了解。
然而,有人建议训练CS-US偶然性包括受试者学习美国是取决于CS和训练发生的背景。因此,自发恢复可能代表残留的情境-美国关联14.然而,这种解释受到自发恢复发生在不同训练背景下的证明的限制。例如,Schachtman等人(1985)在一个环境中熄灭了糖精溶液和氯化锂之间的联系15.当随后放置在不同的环境中,作者报告了糖精溶液和氯化锂之间的关联自发恢复。这些发现与Rescorla-Wagner模型的预测相矛盾,对当代联想学习模型来说,解释这些影响仍然是一个挑战。
回顾学习效应的解释:
该模型也未能解释回溯学习效应。该模型假设,只有在试验中出现刺激时,才会发生对刺激的学习。然而,回溯效应在测试点影响行为,而不是在学习试验期间。回溯学习效应的证据来自“向后阻塞”。这个过程包括训练一个被试CS a向一个US发出信号,在预先训练之后,化合物CS AB向US发出信号。Shanks(1985)证明了这个过程会导致CS B失去联想强度,尽管没有在第二阶段中出现16.例如,一个人可以训练鸽子,音调(CS a)和灯光(CS B)表示食物奖励(US)的交付。在第二阶段,鸽子可能知道孤立的音调会带来食物奖励。在这种情况下,向后遮挡会导致光线和食物之间的联系减弱。
Van Hamme和Wasserman(1994)修改了Rescorla-Wagner(1972)模型,通过提出CS A和CS B之间的复合内关联在训练第一阶段的并发呈现中发展,来解释这些影响17.因此,在第二阶段中CS A的表现唤起了对CS B的表现,从而引发了对CS B的“期望”。由于CS B没有在第二阶段中出现,因此存在一个负预测误差,因为CS B被期望出现,但并没有出现,导致CS B的联想强度下降。这些理论对回溯性学习效应提供了简洁的解释,但是需要后续的实验来严格检验这些解释。
总结:
总之,虽然Rescorla-Wagner(1972)模型有各种缺陷,但这种概念化联想学习的计算方法彻底改变了理论家理解学习的方式。罗伯特·瑞斯科拉教授很大胆,大胆地进入了一种新的思维方式。正是这一飞跃激励了无数心理学家,并将继续激励下一代人。虽然这个模型可能是不完美的,并且留下了许多关于联想学习的悬而未决的问题,但我很高兴看到现在和未来的心理学家如何在Robert Rescorla教授的开创性工作的基础上解决这些问题,并挖掘学习的真正本质。
利亚姆·迈尔斯(Liam Myles)是萨里与边境伙伴关系NHS基金会信托基金的助理心理学家