# 多巴胺

By [bluepoint](https://paragraph.com/@bluepoint) · 2022-03-06

---

多巴胺是众多神经递质中的一种，可以在细胞的突触间隙释放，激活或者抑制下级神经元。能够释放多巴胺神经递质的神经元叫做“多巴胺神经元”。

这部分神经元细胞占大脑的0.0005%。而中脑腹侧被盖区 (ventral tegmental area，VTA) 区域的多巴胺和所谓的快乐感受相关。

多巴胺的本质：奖赏预测误差
-------------

Schultz等人在1997年提出了“奖赏预测误差假说 (Reward Prediction Error hypothesis)。RPE，实际得到的减去预测的奖励或奖励信号（预测的奖励可以理解为期望）。即在RPE为正时，多巴胺有更多的释放，表现为快乐。

> RPE=奖赏-期望

![多巴胺响应曲线](https://storage.googleapis.com/papyrus_images/50e429c2f5cb86e4c13a86813d7a51d16c69b0765fc3ccd40154cc18331b1ff8.png)

多巴胺响应曲线

观察上面图的Outcome阶段：

上图：奖赏为正，期望为0，RPE > 0

中图：奖赏为正，期望为正，RPE = 0

下图：奖赏为0，期望为正，RPE < 0

而对于Cue，即提示阶段，因为提示是突然出现的，所以期望始终为0，只要出现了提醒（一种信息的奖赏），都是RPE > 0。

多巴胺对快乐的启示
---------

根据上述多巴胺的机制，我们可以发现：

1.  保持低的期望值，容易得到快乐。
    
2.  在获得阶段性成功，或者登顶后不再兴奋和快乐。因为，期望和奖赏相符。此时，需要更大的成功奖赏，即高于当下的期望，才能带来快乐。
    
3.  期望越大，在没有得到奖赏时，失望可能越大，进而带来挫折感。
    

利用多巴胺促进延迟满足
-----------

那么，生活中，有些活动是可以得到即时奖励的，而得不到即时奖励的，如何做到延迟满足呢？例如健身需要长的时间才能看到效果，同样地，小孩的学习需要一段时间后才能看到进步。根据这个多巴胺的机制，可以有以下方法来促进延迟满足：

1.  确保得到奖赏。如果现实没有得到奖赏，那么自我给予奖励。例如：
    
    \-锻炼10次后，吃一次牛排。
    
    \-小孩学习后，给予礼品奖励。
    
2.  设置和保留较低的期望值。
    
    \-可以把大的目标拆小，先实现容易达到的目标。
    
3.  在得到奖赏后，继续练习，并小步提高期望值，从而产生正反馈循环。
    
    根据期望和实际奖赏的差异，不断动态调整期望的过程和机器学习中的强化学习理论相似。
    

多巴胺与学习和创造力
----------

1.  多巴胺和未来的期望相关。而未来的期望的另外一个代名词是：欲望。正是多巴胺引导的人类的欲望，驱动人不断努力，不断学习。
    
2.  由于大脑在学习时，采用匹配模式，用现有的模型不断和现实匹配。如果观测的世界和现有模型不同，会产生多巴胺的释放。因此，人有好奇心，寻求未曾有的体验。
    
3.  如果人的经历都是和预期的模型一致，那么无法带来乐趣，也就没有学习的成果。因此，学习是会带来快乐的，但是要避免重复性的学习。
    
4.  而非重复性的学习，意味着创新，创造，探索，冒险。
    
5.  欲望是感性的。而额叶，理性的思考，可以抑制多巴胺的传递，从而控制欲望。另外一方面，纯粹的理性，可能带来保守，缺乏创造。

---

*Originally published on [bluepoint](https://paragraph.com/@bluepoint/LK8DWeVkUlmDoIwiP0bC)*