神经效应定律的证据:大脑如何追求快乐
在19世纪晚期,心理学家爱德华·桑代克提出了他的“效果定律”,指出在特定情况下产生令人满意效果的行为更有可能在这种情况下再次发生,即被重复。任何导致不良后果的行为都可能被制止。
爱德华·桑代克用猫做实验的视频。图片来源:Geert Stienisson, YouTube
在他们最新发表的论文中科学.哥伦比亚大学祖克曼研究所的鲁伊·科斯塔(Rui Costa)教授的团队用老鼠而不是猫揭示了效应定律的神经基础。他们运用巧妙的技术表明,奖励行为背后的神经活动被更频繁地激活。在他们的实验中,他们发现老鼠学会了重复大脑活动的模式,从而触发大脑奖励区域的多巴胺释放。此外,他们还表明,这些模式是逐步和持续加强的,并使它们在实现多巴胺释放强化方面更加可靠。
科斯塔教授说:“众所周知,我们从做自己喜欢的事情中获得快乐,比如玩我们最喜欢的电子游戏。这些结果表明,大脑会学习哪些活动模式会带来感觉良好的感觉,并自我重塑,以更有效地再现这些模式。”
中脑奖励
强化学习被认为是由释放多巴胺的中脑神经元介导的,多巴胺是大脑中的“奖励”分子。当动物因为某个行为而得到奖励时,中脑腹侧被盖区(VTA)的多巴胺神经元会产生一连串的活动,导致多巴胺的释放。
基于桑代克的行为原理和多巴胺在中脑释放的证据,科斯塔的研究小组推断,“效应定律”一定与神经有关。
更进一步,他们提出了一个问题,“大脑能否被训练成学习正确的神经元活动模式,通常涉及体验愉快的事情,然后随意回放该模式,以触发多巴胺的释放?”
训练大脑自我奖励
该团队使用了一种脑机接口,通过音符的产生来改变运动皮层中神经元群的电活动。如果小鼠通过协调神经元活动来学会以正确的顺序发出正确的音符,其腹侧被盖区多巴胺神经元将通过光刺激被激活。这是通过在大脑的这个区域放置一个光导器,并在多巴胺释放神经元中表达视紫红质通道来实现的,视紫红质通道可以激活神经元对蓝光的反应。在对照组动物中,光导仍然被激活,然而,刺激多巴胺释放神经元的光激活蛋白不存在。这意味着对照组动物可以让灯光工作,但没有得到多巴胺释放的强化。
使用这种“闭环”自我刺激系统,研究小组可以观察到,当老鼠学会协调脑细胞活动来演奏正确的音符顺序时,神经强化发生了。而在对照组小鼠的腹侧被盖神经元中没有表达光激活蛋白,因此没有观察到学习。
“从本质上讲,老鼠学会了重复之前听到这些音符时唤起的相同的大脑活动模式,”加州大学伯克利分校的博士候选人、该论文的共同第一作者维韦克·阿塔耶(Vivek Athalye)说。
“在某些方面,这些结果完全在意料之中,”科斯塔教授说。“大脑会通过产生相应的神经活动模式来模仿从愉快体验中获得的奖励感觉,这是有道理的。但它从未经过测试。”
训练重组了相关的脑细胞活动
深入研究后,研究小组探索了神经活动模式如何随着每天重复任务而变化。他们发现,与对照组小鼠相比,在VTA中接受多巴胺释放的组神经元中的神经元活动更加一致。
重要的是,作者注意到VTA激活不太可能直接导致运动皮层神经元神经活动的变化,该区域的变化是由不同的机制引起的。
理解这些机制将为强迫症(OCD)等疾病的治疗提供治疗机会,合著者Jose Carmena教授解释说:“这项研究对先进神经疗法的发展也有重要意义,这些系统将通过修改患者的神经活动模式来治疗大脑疾病的潜在原因。”
“例如,如果大脑的活动模式超速运转,就像成瘾或强迫症患者一样,我们能否创建一个计算机程序来帮助重新训练他们的大脑,并降低这种活动?”科斯塔教授问。“这是我们正在积极探索的事情。”
揭示效应定律的神经基础是理解人脑功能组织和学习原理的重要一步,将神经元活动与行为联系起来。
参考:
Athalye,虚拟现实。,桑托斯,FJ。, Carmena, JM。,科斯塔,RM。2018年,“神经效应定律的证据”。科学