龙年吃太饱 | 过情人节还是迎财神？大年初五的难题

中科院物理所
中科院物理所官方账号

02-14 21:44

原创：中科院物理所

“大年初五财神至，喜禄春风进万家”。俗以正月初五为财神生日，是中国民间迎财神的日子。而今年更为特殊，迎财神和情人节的日子撞上了。是为了祈求一年的好财运而举办迎财神活动，还是和心上人一起度过一个甜蜜的情人节呢？

500

在噼里啪啦的欢腾里，在年味正浓的新春时光中，个人情感问题总是备受关注，如果没有对象的话，那么选择过情人节应该是个零概率事件，因为单身贵族们完全不需要纠结，已经欢天喜地迎财神了。接下来，我们站在第三方的视角，来思考广大有对象的群体会如何选择。

过情人节和迎财神，两种决策的概率

如何分布？

把问题模型简化和具象化，选取样本对象为：有对象的人。他们会选择哪种方式来度过自己的大年初五呢，选择过情人节或迎财神的人群比例分别是多少呢？选择过情人节的人群中是有钱群体的概率是多少呢？

500

假如你正处于一段甜蜜的恋爱中，你身边的人也沉浸在成双成对的幸福中，那么你会不会觉得大多数有对象的人应该都会去过情人节吧？

500

但如果你现在饱受金钱的困扰，会不会觉得即使有对象也会选择迎财神呢，能选择过情人节的人应该大部分很有钱吧？

500

很明显，这些答案都带有强烈的个人色彩。心理学研究显示，事物的可想象性、新近性、显著性、生动性等因素会影响人的记忆和认知。

可被我们想象出来的、在我们身边发生的以及反复被强调的事更容易被从记忆库中调出来，成为我们的认知依据。

那么事实到底是怎样呢？学过概率论的小伙伴们应该遇到过一个很经典的问题。如果有一种疾病发病率是0.1%，针对这种疾病测试（阳性或阴性）的准确率是99%。请问如果一个人测出了阳性，那么他真的得病的概率是多少？

不要轻易相信直觉，特别是对于概率问题。

500

也许有人第一反应是得病的概率是99%。思维陷阱在于：一般而言，我们会把阳性和得病绑定，因为阳性是得病的典型特征，但是忽略了不得病的人群基数其实是更大的。实际上真的得病的概率为：

500

很明显，这个概率远低于我们的直觉。

也就是说，测出阳性后得病的真实概率除了考虑测试准确率"99%"，这个“代表性概率”，还应该考虑无条件概率，也就是在人群中随机挑选，极低的发病的概率。而我们往往会过于关注代表性特征，而忽略了其他的重要信息，这就是我们常见的认知误区——代表性偏差。

500

回到我们的正题，两者类比，得病和不得病对应有钱(事件M)和缺钱(事件SM)，阳性和阴性对应过情人节(事件Y)和不过情人节（迎财神(事件N))。虽然有点扎心，但是有钱到不重视财运的人群比例确实较少。

我们假定：有钱就是摆脱了金钱的束缚和诱惑，有钱群体中几乎所有人都选择过情人节，概率为P(Y|M)，接近1；缺钱群体中大部分人选择迎财神，概率为P(N|SM)，大于0.5；有钱和缺钱群体的人数比例按照经济学的二八定律简单估算一下为：2：8。

很明显，过情人节还是迎财神的概率分布，受到多种因素的影响，离不开经济状况和大家心中的价值排序。当经济状况改变时，有钱(事件M)和缺钱(事件SM)群体的比例会改变，当钱和情的价值排序变化时，概率P(N|SM)和P(Y|M)也会动态变化。下图为一种可能的概率分布：

500

过情人节群体中为有钱群体的概率为：

500

经过计算可知，当P(Y|SM) > 0.25时，P(M|Y) < 0.5，即当缺钱群体中选择过情人节的比例超过25%时，过情人节群体中缺钱群体的比例更高。

这种情况打破了我们一般的思维惯性，因为缺钱群体的人数更多，所以过情人节中有钱者的概率有可能更小。

掀起概率的头纱：贝叶斯派

上文真实概率的计算中使用的便是大名鼎鼎的贝叶斯公式：

500

P(Ai)是事件Ai的先验概率，之所以称为"先验"，是因为它不考虑任何其他方面的因素。但是如果事件Ai的发生受到事件B的影响，那么其概率需要更新为条件概率P(Ai|B)，也被称作Ai的后验概率。

在统计学领域，存在着两大主流学派——频率学派和贝叶斯学派。历史上，针对“概率是什么”等本质问题，频率学派和贝叶斯学派曾争论不休，贝叶斯统计也曾受到主流数学家的排斥，但是如今贝叶斯概率已经成为一个热门课题，在机器学习以及量子力学等重要领域都有应用。

500

图源：网络

贝叶斯学派核心理念是观察者可以通过不断进行观测或实验获得新证据来及时调整、更新对事件发生概率的认知。也就是不断增加条件B来更新对事件A发生概率的认识。

而频率学派的核心思想是基于大样本理论，将概率定义为随机事件多次发生的频率的极限。当样本数量足够大时，频率就逼近于客观概率。

但有些时候我们无法获得大量样本，那么我们也无法获得真实的概率。对于小样本数据，贝叶斯学派便是解决这个问题的一把利器。

贝叶斯学派认为概率可以是一个动态的变量，概率被定义为对事件的信任程度，这是一种基于观察者内部知识体系的主观信念。例如，你认为飞机失事的概率取决于你对飞机失事发生的信心，如果你非常相信飞机这种交通工具，那么你认为的概率就越小。当然，我们的最初想法（先验）未必是准确的，所以我们需要新数据来更新我们的先验概率。

500

拿最简单的抛硬币模型为例，我们设定这是一枚公平（即硬币抛出正反面的概率相同）硬币的先验概率为P(A)=0.9（即信任度为90%）。接着，通过不断地抛硬币来获得新的实验数据，以此更新我们的先验概率。

500

首先将硬币抛掷抛一次，结果为硬币是正面，将第一次实验得到的数据结果命名为事件O，根据贝叶斯公式，可计算出：在事件O发生的条件下，硬币是公平的条件概率为：

500

抛第二次，硬币仍然是正面，先验概率被更新为P(A | OO)，根据上述方法，计算得到概率P(A | OO) = 0.69;以此类推，P(A | OOO) = 0.53，P(A | OOOO) = 0.36，当连续四次抛出正面时，对这枚硬币是公平的信任度急剧下降，这说明该硬币很有可能是一枚不均匀的硬币，或者是一枚两面都是正面的硬币。

贝叶斯学派便是利用这样一种方式将先验概率与样本数据进行结合，得到后验概率，并以此作为对未知量的推断。

贝叶斯理论扩展了概率的涵义，概率可以是一种主观置信度，是对一个事件的信任程度，让主观概率的概念走入人们的视野。

感受一下主观概率

以三门问题为例：三扇关闭的门后面分别藏着汽车和两只羊，参赛者需要选中藏有汽车的门才能赢奖；如果参赛者先选定了一扇门但未打开，这时已知答案的主持人打开了剩下两扇门中有羊的一扇，那么请问参赛者要不要选择另一扇门呢？

500

图源：网络

把这个问题拓展一下会很好理解，非常契合我们“敏锐的第六感”。如果现在改为有十扇门（其实多多益善），你先任意选一扇，主持人在剩下的九扇门中一扇一扇的打开，打开了八次，门后出现的都是羊，那么留下的最后一扇门中有汽车的概率是不是很大呢？你要不要换呢？

其实，最开始你的选择便把抽中大奖的概率不均等的一分为二：分别是你选择的那扇门占据的1/10的概率，和主持人在剩下的九扇门中进行操作而重新分配的9/10的概率。主持人的操作便是在把中奖的几率逐渐累加在最后未被打开的一扇门上，在这种情况下，如果你选择换，那么中奖的概率会有9/10，交换让中奖率翻了9翻，当然要换。

500