本篇简单探讨贝叶斯公式的历史演进和基础应用,是《白话高中数学——概率和统计》漫谈的第11篇短文。
在条件概率的范畴内,除了全概率公式之外,另一个与条件概率紧密相关,且具有深远影响的重要应用是贝叶斯公式。
英国数学家托马斯·贝叶斯(Thomas Bayes)在1761年发表了一篇旨在解决“逆概率”问题的论文,提出了通过一个观察到的统计概率,去反推另外一个假设概率的理论方法,不过他本人当时并没有深入发展这一理论,19世纪初,法国数学家 皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace),把这一理论推广到更广泛的统计领域,形成了现代贝叶斯统计学的基础。
贝叶斯公式描述的是条件概率的逆向推理,核心思想是通过已知的信息,这些信息可能是历史统计信息或者是一种经验,又或者是根据已有知识进行的概率估计——也就是先验概率,结合新情况下得到的数据,反向修正已有的假设或预测,从而更加准确的反映现实情况,得到新情况下的后验概率。
其数学表达为:
P(A∣B):后验概率,表示在事件B发生的条件下,事件A发生的概率——这是我们要经过反向推理计算得到的数据。
P(B∣A):似然度(Likelihood),表示在事件A发生的条件下,事件B发生的概率,也就是新情况下得到的数据。
P(A):先验概率(Prior),表示在观察到任何新的证据之前,事件A发生的初始概率。
P(B):边际似然(Marginal Likelihood),表示事件B发生的总概率,可通过全概率公式计算。
贝叶斯公式中出现了几个中学生不太好理解的新名词,不用担心,我们举一个生活中的例子,大家就明白了。
话说根据历年的统计数据,人群中感冒的比例(可以理解为概率)为5%(先验概率),感冒人群中发烧的比例为10%(似然度),假设非感冒引起的发烧在人群中的占比为30%,现在门诊来了一位发烧的病例,请问这位发烧的病例,得了感冒的概率是多少(后验概率)?
这就是一个反向求索的经典例子,我们可以根据贝叶斯公式,求得发烧人群中,得了感冒的比例是多少。
首先定义感冒为事件A:P(A)=5%
定义发烧为事件B:P(B)=发烧的概率。
发烧的概率是一个全概率,它是两个互逆事件的概率之和,也就是既感冒又发烧的概率+不感冒情况下发烧的概率。
既感冒又发烧的概率为P(AB)=P(A)P(B|A)=5%×10%=0.005
不感冒情况下发烧的概率:P(不感冒发烧)=P(不感冒)P(发烧|不感冒)=(1-5%)×30%=0.285
把二者加在一起就是发烧的全概率:
根据贝叶斯公式:
这就是说,门诊发烧病例中,约有1.7%是感冒引起的。
这个例子的数据是我随手编的,不是实际的统计数据,但它很好地展示了如何使用贝叶斯定理进行逆向推理,并根据新的证据(发烧)更新我们对某事件(感冒)发生的概率估计。
其实在中学阶段,我们对先验概率、似然度、后验概率这几个名词完全可以不去管它,我们只需通过概率的乘法公式以及条件概率、全概率这些熟悉的公式来理解它就可以,比如这个条件概率公式:
分子是指AB同时发生的概率,它可以写成A的概率与A条件下B发生的概率乘积:
这样条件概率公式就可以写成简化的贝叶斯公式:
需要注意的是,上述贝叶斯公式虽然可以通过条件概率推导出来,但二者还是有着本质区别的。
原因在于贝叶斯公式中,分母 P(B) 是一个全概率,它需要根据实际场合求出。
它可以是基于与 A 事件相关的样本空间计算得出,即考虑所有可能的 A 事件(或其补集)前提下 B 事件发生的全概率。
也可以通过独立于 A 事件之外的其他因素或背景信息求得。这意味着在实际问题中,确定 P(B)的值需要全面考虑所有可能影响 B 发生的因素。
不过不用担心,划线文字提到的这种情况,我们中学阶段还很少涉及,这对中学生来说,或许是个好消息。
在中学阶段遇到的与贝叶斯定理相关的试题,通常会围绕一些具体的、易于理解的场景来设计,场景分类大致如下:
医学检测场景:例如已知某种疾病的患病率,以及一种诊断测试的准确率。问题可能会问:如果一个人的测试结果为阳性,那么这个人实际患病的概率是多少?
这个场景我们在概率漫谈(八)短文中有一个类似的例题,大家可以点击链接查看。
产品质量控制场景:试题可能涉及已知某生产线上的产品缺陷率,以及质检过程中的检测准确率。问题可能会问:如果一个产品被标记为次品,它是真正次品的概率是多少?
天气预报场景:
给出历史数据后,问题可以是:如果气象模型预测明天会下雨,基于历史数据,明天实际下雨的概率是多少?
游戏或抽奖场景:
例如,在一个抽奖活动中,已知获奖的概率,以及某种特定行为(如购买额外的抽奖机会)对获奖几率的影响。可能会问:采取这种行为后,实际赢得奖品的概率是多少?
犯罪调查场景:
比如,已知人群中某一特征出现的概率,以及拥有该特征的人成为犯罪嫌疑人的可能性。问题可能是:如果发现一名嫌疑人具有这一特征,他实际是罪犯的概率是多少?
等等。
这类题目不仅考验学生的数学能力,还促进了他们逻辑思维和解决问题的能力的发展。
我们会在接下来的短文中,设计几个例题,和大家一起讨论。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。