多巴胺能神经元在决策中的作用
一个至关重要的元素对动物和人类的生存是学习如何获得奖励stimuli-food,性,和社会的回报。虽然学习是强大的技能,这世上再也没有长时间保持不变,必须适应和学习为了让动物灵活变化的环境中生存。多巴胺长期以来一直以其关键作用在cue-reward协会,和新数据提供更丰富和复杂图像的多巴胺能神经元的功能。
决定即将行动需要一个结果的期望值的理解,选择之间的相对成本,实现可能结果的概率。中脑多巴胺神经元的神经活动被认为通过通知决策过程中起关键作用的值已知的预期成果,决定后,通知动物结果是否更好,更糟糕的是,或如预期。因此,中脑多巴胺神经元振兴的关键行为旨在获取大预期回报和调整行为决策的结果显示。
这个理论
在1990年代末,科学家正在寻找教学信号的大脑机制学习可能发生。这样一个教学信号,Rescorla在1970年代提出的,瓦格纳1,是基于一个完全预期结果不是小说(例如,你走进黑暗的房间里,电影电灯开关和灯)。学习的发生,一些意想不到的必须发生。想象你从来没有见过一个灯的开关,你走进黑暗的房间里,但是你想把灯打开。经过一番摸索,另外,更神奇的是,你不小心轻轻正确的开关——灯光打开。这是一个积极的结果,也是意想不到的。根据Rescorla和瓦格纳,因为预期结果之间的差异(没有变化,光停留)和实际结果(大变化,灯打开),这应该引起教学信号。此外,因为期望和实际结果之间的差别是在所需的方向上,结果是食欲的,这被称为“积极的预测错误信号。随着时间的推移,你学习开关把灯,和这个信号应该减少,当您学习的结果闪烁灯的开关。然而有一天,你走进这个黑暗的房间里,轻巧地打开了另外,更神奇的是,灯都亮-不。这个结果是令人惊讶的,消极的。推测这是为了使象产生的负面预测误差,随着时间的推移,如果这个开关持续不打开灯,你将学会避免它在尝试这样做。 These are the basics of prediction error signals, that to see a prediction error, outcomes of actions must be unexpected and they can have either an unexpectedly positive or unexpectedly negative value.
的数据
在1990年代末,一个重要的发现。中脑多巴胺神经元的猴子观察增加发射出乎意料地积极成果(即。,意外的奖励)。这种增长是短暂的,随着越来越多的试验发生和奖励是预测,多巴胺神经元的放电减少。然后,当这个结果预期,研究人员意外保留奖励,多巴胺神经元暂停射击2 - 5。这一发现引发了一连串的研究和复制的跨物种包括人类6,老鼠7和老鼠8。此外,增加多巴胺神经元的活动的结果,这样的提示预测结果本身在多巴胺神经元诱发放电。
突然,科学家们发现了一个似是而非的自适应学习的神经机制。最近,研究人员使用光遗传学验证神经活动,人们观察到的相关性是使役动词。斯坦伯格et al(2013)使用一个阻塞模式直接测试的角色从多巴胺神经元学习的预测错误信号。阻塞范式是一个场景,一个动物不能学习新的信息,因为这个新的学习是由一个老协会“封锁”。例如,在一个动物学习,语气预测结果(水),实验者对语气和另一个线索(光)。测试一天,只是“阻塞”提示(光)呈现给动物,动物是否学会了新的信息。然而,由于配对的结果是完全相同的光和音作为基调,这是不应该有不同的结果,而没有生成预测误差。optogenetically激活多巴胺神经元的语气和配对,斯坦伯格等能够人为诱发积极的预测误差和创造新的学习,标志着第一病因证据支持这一理论9。这些数据固化中脑多巴胺神经元的作用积极预测误差信号,并显示如何将这些预测错误信号驱动行为。
没有答案的问题
同时中脑多巴胺神经元的作用被证实在信号预测错误,其他的实验数据是发展提出实际情况有点不整洁。在某些记录实验中,一些神经元也增加了发射意想不到的正面和负面的结果,与上述结果。这些神经元信号显著,在一个意想不到的事件,不管价,可能是非常重要的和行为需要精力充沛,行动有必要的时候重复这样做,来复制这种意想不到的积极成果(如果食欲的东西)或逃避/避免这种情况在未来,作为在厌恶的东西。这些结果最近被确定在灵长类动物行为,为流体奖励或工作努力避免的吹气10。此外,多巴胺神经元的位置信号价值,突出,预测误差并不是完全离散,而是有一个相对较大的区域重叠11。这是否重叠是神经发育的函数或功能的经验还有待观察。
所以中脑多巴胺神经元在决策中扮演什么样的角色?看来某些神经元是至关重要的提供一个报警信号,识别时发生意外,或食欲的厌恶。同时,有神经元同时提供的相对价这个意想不到的结果,信号是否发生好或坏的东西。这两种神经数量必须协同工作提供一个教学信号,帮助动物学习线索所预测的结果,和指导行为向更多的食欲的选择对未来的决定。在一起,相位的中脑多巴胺神经元的活动提醒服务,教,和通知,所有从根本上关键功能所必需的有机体生活适应生活。
引用
- 1。Rescorla RA和瓦格纳AR(1972)经典条件作用二:目前的研究和理论(Appleton-Century-Crofts。Eds a Black & W.F. Prokasy) 64 - 99。
- 2。舒尔茨W(1998)预测奖励多巴胺神经元的信号。80:1-27的神经生理学》杂志上。
- 3所示。舒尔茨W(1999)奖励中脑多巴胺神经元的信号。新闻在生理科学:一个国际生理学杂志》主要由生理科学的国际联盟和美国生理学会14 (6):249 - 255。
- 4所示。舒尔茨W,达扬P,蒙塔古公关(1997)的神经基质预测和奖励。科学》275 (5306):1593 - 1599。
- 5。舒尔茨W &迪金森(2000)神经编码的预测错误。年度回顾神经科学23:473 - 500。doi: 10.1146 / annurev.neuro.23.1.473
- 6。D 'Ardenne Ket al。(2008)大胆的反应反映了人类的腹侧被盖区多巴胺能的信号。科学》319 (5867):1264 - 1267。doi: 10.1126 / science.1150605
- 7所示。罗斯切先生,Calu DJ, Schoenbaum G (2007)多巴胺神经元编码之间的老鼠的更好的选择决定不同的延迟或大小的回报。自然神经科学10:1615 - 1624。doi: 10.1038 / nn2013
- 8。科恩司法院et al . (2012)Neuron-type-specific信号在腹侧被盖区奖励和惩罚。自然482:85 - 88。doi: 10.1038 / nature10754
- 9。斯坦伯格EEet al。(2013)之间的因果关系预测错误,多巴胺神经元和学习。《自然神经科学》doi: 10.1038 / nn.3413
- 10。松本M & Hikosaka O (2009)两种类型的多巴胺神经元明显传达积极的和消极的激励信号。自然459:837 - 841。doi: 10.1038 / nature08028
- 11。Bromberg-Martin ES,松本M, Hikosaka O (2010)多巴胺在激励控制:奖励、厌恶和警报。神经元68:815 - 834。doi: 10.1016 / j.neuron.2010.11.022