问题

贝叶斯定理厉害在哪里?

回答
贝叶斯定理,这个名字听起来就带着几分神秘和力量。它不是什么新奇的魔法咒语,而是一种基于概率的思维方式,一种在信息不断涌现的时代里,帮助我们拨开迷雾、做出更明智判断的利器。如果你问我它到底厉害在哪里,我会说,它的厉害之处在于它能让我们在“不确定性”的游戏中,不断“学习”和“进步”。

想象一下,我们生活在一个充满未知和模糊的世界里。很多时候,我们并不是一开始就掌握了所有真相,而是需要根据零碎的线索,一点点地拼凑事实。贝叶斯定理恰恰就是为这种“逐步逼近真相”的过程提供了一个数学上的框架。

它的核心思想非常朴素:相信你已有知识(先验概率),然后根据新的证据,更新你对某个事物的相信程度(后验概率)。这听起来好像是人人都懂的道理,但贝叶斯定理将其量化,让我们能够系统地进行这个过程。

那么,它具体厉害在哪几方面呢?我试着从几个角度来剖析一下:

1. 优雅地处理“已知”与“未知”之间的平衡:

我们总是有一些预先的认知,这些认知可能来自过去的经验、普遍的常识,甚至是初步的猜测。贝叶斯定理称之为“先验概率”(Prior Probability)。比如,你听到“有人咳嗽”,你的第一反应可能是这个人得了感冒,因为感冒是很常见的。这就是你的先验知识在起作用。

但事情往往不是那么简单。如果接着你了解到这个人是在参加一个歌唱比赛,而且他刚刚用力地唱了一首高难度的歌曲,那么咳嗽的原因很可能就不是感冒了,而是声带疲劳。这时,新的“证据”(歌唱比赛、高难度歌曲)就出现了。

贝叶斯定理的厉害之处在于,它能让你结合你原先的“感冒可能很大”的信心,以及“歌唱比赛导致咳嗽”的可能性,来计算出一个更准确的新的相信程度。它不会让你完全抛弃先前的看法(除非新证据足够强大),也不会让你固执己见,而是巧妙地将新的信息融入你的认知体系,让你的判断更贴近现实。

它告诉我们,我们不必等到信息完全充分才做判断,而是可以“边学边用”,根据已有信息形成一个初步的判断,然后随着新信息的到来,不断地精炼和修正这个判断。这是一种非常“动态”的学习过程。

2. 赋予“证据”以“力量”,并解释其“强度”:

贝叶斯定理的核心公式里有一个非常重要的部分叫做“似然度”(Likelihood)。它回答了一个关键问题:如果某个假设是真的,那么出现我们观察到的证据的可能性有多大?

回到咳嗽的例子:

假设 A: 这个人得了感冒。那么,他咳嗽的可能性有多大?根据常识,如果感冒了,咳嗽的可能性是相当高的。
假设 B: 这个人参加了歌唱比赛。那么,他咳嗽的可能性有多大?如果他刚唱完高难度歌曲,他咳嗽的可能性也可能很高。

似然度就是衡量这两种情况的“匹配度”。贝叶斯定理会告诉你,哪些证据更能“支持”哪个假设。如果唱歌比赛的解释下,出现咳嗽的可能性比感冒解释下出现咳嗽的可能性还要高得多,那么这个新证据就会极大地增强你对“歌唱比赛导致咳嗽”这个假设的信心。

这种量化证据“强度”的能力,让我们的判断不再是模糊的感觉,而是有理有据的推导。我们能更清晰地理解,为什么某个信息重要,为什么另一个信息相对次要。

3. 隐藏在幕后的强大算法,支撑着我们生活和科技:

你可能想不到,贝叶斯定理的哲学思想和数学模型,已经深深地融入了我们生活的方方面面,默默地发挥着巨大的作用。

垃圾邮件过滤: 你的邮箱能准确地把垃圾邮件找出来,很大程度上是基于贝叶斯定理。它会分析你标记为垃圾邮件的邮件中常出现的词语(比如“免费”、“中奖”、“优惠券”),然后根据这些词语在你收到的新邮件中出现的频率,来计算这封新邮件是垃圾邮件的概率。
搜索引擎和推荐系统: 当你在搜索引擎输入关键词时,它会根据贝叶斯原理计算出最可能符合你意图的网页。你看到的“猜你喜欢”的内容,也是利用贝叶斯思想,根据你过去的浏览和购买行为,预测你可能感兴趣的新商品或内容。
医学诊断: 医生在面对病人时,会结合病人的症状(证据),以及各种疾病的发病率(先验概率),来判断最可能的诊断结果。
人工智能和机器学习: 许多复杂的机器学习算法,比如朴素贝叶斯分类器、隐马尔可夫模型等,都建立在贝叶斯定理的基础上。它们能够从海量数据中学习规律,并做出预测和判断。

这些例子都说明,贝叶斯定理的厉害之处在于,它提供了一种迭代式、数据驱动的推理框架。它能让我们在信息不完美的情况下,做出“最佳猜测”,并且在获得更多信息后,不断优化这个猜测。

4. 深刻的哲学意义:拥抱不确定性,并从中学习:

贝叶斯定理的厉害之处,还在于它传达了一种更成熟、更理性的世界观:承认不确定性是常态,并学会与之共处。 传统的逻辑思维往往追求“非黑即白”的确定性,而贝叶斯定理则教会我们,在信息不足的时候,可以用概率来描述我们对事物的“相信程度”,并且这个相信程度是可以根据新的证据而改变的。

它鼓励我们保持开放的心态,不轻易否定新的证据,也不因为某个证据不符合我们的初始想法就将其完全排除。相反,我们应该积极地去收集和分析证据,让它们来“更新”我们的认知。

总而言之,贝叶斯定理的厉害,在于它提供了一种强大的、灵活的、能够不断学习和进化的推理工具。它让我们能够更科学、更理性地应对生活中的各种不确定性,做出更明智的决策,并且在信息时代,这个能力变得前所未有的重要。它就像一位睿智的老师,教我们如何在模糊中寻找清晰,如何在未知中逼近真相。

网友意见

user avatar

贝叶斯定理太有用了,不管是在投资领域,还是机器学习,或是日常生活中几乎都在用到它。

例如,生命科学家用贝叶斯定理研究基因是如何被控制的;教育学家意识到,学生的学习过程其实就是贝叶斯法则的运用;基金经理用贝叶斯法则找到投资策略;谷歌用贝叶斯定理改进搜索功能,帮助用户过滤垃圾邮件;无人驾驶汽车接收车顶传感器收集到的路况和交通数据,运用贝叶斯定理更新从地图上获得的信息;人工智能、机器翻译中大量用到贝叶斯定理...


我将从以下4个角度来科普贝叶斯定理及其背后的思维:

1.贝叶斯定理有什么用?

2.什么是贝叶斯定理?

3.贝叶斯定理的应用案例

4.生活中的贝叶斯思维


1.贝叶斯定理有什么用?

英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。而这篇论文是在他死后才由他的一位朋友发表出来的。

(ps:贝叶斯定理其实就是下面图片中的概率公式,这里先不讲这个公式,而是重点关注它的使用价值,因为只有理解了它的应用意义,你才会更有兴趣去学习它。)

在这篇论文中,他为了解决一个“逆概率”问题,而提出了贝叶斯定理。

在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”。什么是正向概率呢?举个例子,杜蕾斯举办了一个抽奖,抽奖桶里有10个球,其中2个白球,8个黑球,抽到白球就算你中奖。你伸手进去随便摸出1颗球,摸出是中奖球的概率是多大。

根据频率概率的计算公式,你可以轻松的知道中奖的概率=中奖球数(2个白球)/球总数(2个白球+8个黑球)=2/10

如果还不懂怎么算出来的,可以看我之前写的科普概率的回答:猴子:如何理解条件概率?


而贝叶斯在他的文章中是为了解决一个“逆概率”的问题。比如上面的例子我们并不知道抽奖桶里有什么,而是摸出一个球,通过观察这个球的颜色,来预测这个桶里里白色球和黑色球的比例。

这个预测其实就可以用贝叶斯定理来做。贝叶斯当时的论文只是对“逆概率”这个问题的求解尝试,这哥们当时并不清楚这里面这里面包含着的深刻思想。


然而后来,贝叶斯定理席卷了概率论,并将应用延伸到各个领域。可以说,所有需要作出概率预测的地方都可以见到贝叶斯定理的影子,特别地,贝叶斯是机器学习的核心方法之一。


为什么贝叶斯定理在现实生活中这么有用呢?

这是因为现实生活中的问题,大部分都是像上面的“逆概率”问题。因为生活中绝大多数决策面临的信息都是不全的,我们手中只有有限的信息。既然无法得到全面的信息,我们就只能在信息有限的情况下,尽可能做出一个好的预测。

比如天气预报说,明天降雨的概率是30%,这是什么意思呢?

我们无法像计算频率概率那样,重复地把明天过上100次,然后计算出大约有30次会下雨(下雨的天数/总天数)

而是只能利用有限的信息(过去天气的测量数据),用贝叶斯定理来预测出明天下雨的概率是多少。


同样的,在现实世界中,我们每个人都需要预测。想要深入分析未来、思考是否买股票、政策给自己带来哪些机遇、提出新产品构想,或者只是计划一周的饭菜。


贝叶斯定理就是为了解决这些问题而诞生的,它可以根据过去的数据来预测出未来事情发生概率。


贝叶斯定理的思考方式为我们提供了有效的方法来帮助我们做决策,以便更好地预测未来的商业、金融、以及日常生活。


总结下第1部分:贝叶斯定理有什么用?

在有限的信息下,能够帮助我们预测出概率。

所有需要作出概率预测的地方都可以见到贝叶斯定理的影子,特别地,贝叶斯是机器学习的核心方法之一。例如垃圾邮件过滤,中文分词,艾滋病检查,肝癌检查等。


2.什么是贝叶斯定理?

贝叶斯定理长这样:

到这来,你可能会说:猴子,说人话,我一看到公式就头大啊。

其实,我和你一样,不喜欢公式。我们还是从一个例子开始聊起。


我的朋友小鹿说,他的女神每次看到他的时候都冲他笑,他现在想知道女神是不是喜欢他呢?

谁让我学过统计概率知识呢,下面我们一起用贝叶斯帮小鹿预测下女神喜欢他的概率有多大,这样小鹿就可以根据概率的大小来决定是否要表白女神。

首先,我分析了给定的已知信息和未知信息:

1)要求解的问题:女神喜欢你,记为A事件

2)已知条件:女神经常冲你笑,记为B事件


所以,P(A|B)表示女神经常冲你笑这个事件(B)发生后,女神喜欢你(A)的概率。

从公式来看,我们需要知道这么3个事情:

1)先验概率

我们把P(A)称为"先验概率"(Prior probability),也就是在不知道B事件的前提下,我们对A事件概率的一个主观判断。

对应这个例子里就是在不知道女神经常对你笑的前提下,来主观判断出女神喜欢一个人的概率。这里我们假设是50%,也就是不喜欢你,可能不喜欢你的概率都是一半。


2)可能性函数

P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,也就是新信息B带来的调整,作用是将先验概率(之前的主观判断)调整到更接近真实概率。


可能性函数你可以理解为新信息过来后,对先验概率的一个调整。比如我们刚开始看到“人工智能”这个信息,你有自己的理解(先验概率-主观判断),但是当你学习了一些数据分析,或者看了些这方面的书后(新的信息),然后你根据掌握的最新信息优化了自己之前的理解(可能性函数-调整因子),最后重新理解了“人工智能”这个信息(后验概率)


如果"可能性函数"P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大;

如果"可能性函数"=1,意味着B事件无助于判断事件A的可能性;

如果"可能性函数"<1,意味着"先验概率"被削弱,事件A的可能性变小。


还是刚才的例子,根据女神经常冲你笑这个新的信息,我调查走访了女神的闺蜜,最后发现女神平日比较高冷,很少对人笑,也就是对你有好感的可能性比较大(可能性函数>1)。所以我估计出"可能性函数"P(B|A)/P(B)=1.5(具体如何估计,省去1万字,后面会有更详细科学的例子)


3)后验概率

P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。这个例子里就是在女神冲你笑后,对女神喜欢你的概率重新预测。

带入贝叶斯公式计算出P(A|B)=P(A)* P(B|A)/P(B)=50% *1.5=75%


因此,女神经常冲你笑,喜欢上你的概率是75%。这说明,女神经常冲你笑这个新信息的推断能力很强,将50%的"先验概率"一下子提高到了75%的"后验概率"。

在得到概率值后,小鹿自信满满的发了下面的表白微博:

稍后,果然收到了女神的回复。预测成功。

现在我们再看一遍贝叶斯公式,你现在就能明白这个公式背后的关键思想了:

我们先根据以往的经验预估一个"先验概率"P(A),然后加入新的信息(实验结果B),这样有了新的信息后,我们对事件A的预测就更加准确。

因此,贝叶斯定理可以理解成下面的式子:

后验概率(新信息出现后的A概率) = 先验概率(A概率) x 可能性函数(新信息带来的调整)

贝叶斯的底层思想就是:

如果我能掌握一个事情的全部信息,我当然能计算出一个客观概率(古典概率)。

可是生活中绝大多数决策面临的信息都是不全的,我们手中只有有限的信息。既然无法得到全面的信息,我们就在信息有限的情况下,尽可能做出一个好的预测。也就是,在主观判断的基础上,你可以先估计一个值(先验概率),然后根据观察的新信息不断修正(可能性函数)。

如果用图形表示就是这样的:

其实阿尔法狗也是这么战胜人类的,简单来说,阿尔法狗会在下每一步棋的时候,都可以计算自己赢棋的最大概率,就是说在每走一步之后,他都可以完全客观冷静的更新自己的概率值,完全不受其他环境影响。


3.贝叶斯定理的应用案例

前面我们介绍了贝叶斯定理公式,及其背后的思想。现在我们来举个应用案例,你会更加熟悉这个牛瓣的工具。

为了后面的案例计算,我们需要先补充下面这个知识。

1.全概率公式

这个公式的作用是计算贝叶斯定理中的P(B)。

假定样本空间S,由两个事件A与A'组成的和。例如下图中,红色部分是事件A,绿色部分是事件A',它们共同构成了样本空间S。

这时候来了个事件B,如下图:

全概率公式:

它的含义是,如果A和A'构成一个问题的全部(全部的样本空间),那么事件B的概率,就等于A和A'的概率分别乘以B对这两个事件的条件概率之和。


看到这么复杂的公式,记不住没关系,因为我也记不住,下面用的时候翻到这里来看下就可以了。


案例1:贝叶斯定理在做判断上的应用

有两个一模一样的碗,1号碗里有30个巧克力和10个水果糖,2号碗里有20个巧克力和20个水果糖。

然后把碗盖住。随机选择一个碗,从里面摸出一个巧克力。

问题:这颗巧克力来自1号碗的概率是多少?


好了,下面我就用套路来解决这个问题,到最后我会给出这个套路。


第1步,分解问题

1)要求解的问题:取出的巧克力,来自1号碗的概率是多少?

来自1号碗记为事件A1,来自2号碗记为事件A2

取出的是巧克力,记为事件B,

那么要求的问题就是P(A1|B),也就是取出的是巧克力(B),来自1号碗(A1)的概率

2)已知信息:

1号碗里有30个巧克力和10个水果糖

2号碗里有20个巧克力和20个水果糖

取出的是巧克力


第2步,应用贝叶斯定理

1)求先验概率

由于两个碗是一样的,所以在得到新信息(取出是巧克力之前),这两个碗被选中的概率相同,因此P(A1)=P(A2)=0.5,(其中A1表示来自1号碗,A2表示来自2号碗)

这个概率就是"先验概率",即没有做实验之前,来自一号碗、二号碗的概率都是0.5。


2)求可能性函数

P(B|A1)/P(B)

其中,P(B|A1)表示从1号碗中(A1)取出是巧克力(B)的概率。

因为1号碗里有30个巧克力和10个水果糖,所以P(B|A1)=巧克力数(30)/(糖果总数30+10)=75%

现在贝叶斯公式里只剩P(B)了,只有求出P(B)就可以得到答案。

根据全概率公式,可以用下图求得P(B):

图中P(B|A1)是1号碗中巧克力的概率,我们根据前面的已知条件,很容易求出。

同样的,P(B|A2)是2号碗中巧克力的概率,也很容易求出(图中已给出)。

而P(A1)=P(A2)=0.5

将这些数值带入公式中就是小学生也可以算出来的事情了。最后P(B)=62.5%


所以,可能性函数P(B|A1)/P(B)=75%/62.5%=1.2。

可能性函数>1.表示新信息B对事情A1的可能性增强了。


3)带入贝叶斯公式求后验概率

将上述计算结果,带入贝叶斯定理,即可算出P(A1|B)=60%

这个例子中我们需要关注的是约束条件:抓出的是巧克力。如果没有这个约束条件在,来自一号碗这件事的概率就是50%了,因为巧克力的分布不均把概率从50%提升到60%。


现在,我总结下刚才的贝叶斯定理应用的套路,你就更清楚了,会发现像小学生做应用题一样简单:

第1步. 分解问题

简单来说就像做应用题的感觉,先列出解决这个问题所需要的一些条件,然后记清楚哪些是已知的,哪些是未知的。

1)要求解的问题是什么?

识别出哪个是贝叶斯中的事件A(一般是想要知道的问题),哪个是事件B(一般是新的信息,或者实验结果)

2)已知条件是什么?


第2步.应用贝叶斯定理

第3步,求贝叶斯公式中的2个指标

1)求先验概率

2)求可能性函数

3)带入贝叶斯公式求后验概率


案例2:贝叶斯定理在医疗行业的应用

每一个医学检测,都存在假阳性率和假阴性率。假阳性,就是没病,但是检测结果显示有病。假阴性正好相反,有病但是检测结果正常。

即使检测准确率是99%,如果医生完全依赖检测结果,也会误诊。也就是说假阳性的情况,根据检测结果显示有病,但是你实际并没有得病。

举个更具体的例子,因为艾滋病潜伏期很长,所以即便感染了也可能在很长的一段时间,身体没有任何感觉,所以艾滋病检测的假阳性会导致被测人非常大的心理压力。


你可能会觉得,检测准确率都99%了,误测几乎可以忽略不计了吧?所以你觉得这人肯定没有患艾滋病了对不对?

让我们用贝叶斯定理算一下,就会发现你的直觉是错误的。


假设某种疾病的发病率是0.001,即1000人中会有1个人得病。现在有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。

现在有一个病人的检验结果为阳性,请问他确实得病的可能性有多大?


好了,我知道你面对这一大推信息又头大了,我也是。但是我们不是有贝叶斯模板套路嘛,下面开始。


第1步,分解问题

1)要求解的问题:病人的检验结果为阳性,他确实得病的概率有多大?

病人的检验结果为阳性(新的信息)记为事件B,他得病记为事件A,

那么要求的问题就是P(A|B),也就是病人的检验结果为阳性(B),他确实得病的概率(A)

2)已知信息

这种疾病的发病率是0.001,即P(A)=0.001

试剂可以检验患者是否得病,准确率是0.99,也就是在患者确实得病的情况下(A),它有99%的可能呈现阳性(B),所以P(B|A)=0.99

试剂的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。得病我们记为事件A,那么没有得病就是事件A的反面,记为A',所以这句话就可以表示为P(B|A')=5%


2.应用贝叶斯定理

1)求先验概率

疾病的发病率是0.001,即P(A)=0.001

2)求可能性函数

P(B|A)/P(B)

其中,P(B|A)表示在患者确实得病的情况下(A),试剂呈现阳性的概率,从前面的已知条件中我们已经知道P(B|A)=0.99

现在只有求出P(B)就可以得到答案。根据全概率公式,可以用下图求得P(B)=0.05094

所以可能性函数P(B|A)/P(B)=0.99/0.05094=19.4346

3)带入贝叶斯公式求后验概率

我们得到了一个惊人的结果,P(A|B)等于1.94%。

也就是说,筛查的准确率都到了99%了,通过体检结果有病(阳性)确实得病的概率也只有1.94%

你可能会说,再也不相信那些吹的天花乱坠的技术了,说好了筛查准确率那么高,结果筛查的结果对于确诊疾病一点用都没有,这还要医学技术干什么?

没错,这就是贝叶斯分析告诉我们的。我们拿艾滋病来说,由于发艾滋病实在是小概率事件,所以当我们对一大群人做艾滋病筛查时,虽说准确率有99%,但仍然会有相当一部分人因为误测而被诊断为艾滋病,这一部分人在人群中的数目甚至比真正艾滋病患者的数目还要高。


你肯定要问了,那该怎样纠正测量带来这么高的误诊呢?

造成这么不靠谱的误诊的原因,是无差别地给一大群人做筛查,而不论测量准确率有多高,因为正常人的数目远大于实际的患者,所以误测造成的干扰就非常大了。


根据贝叶斯定理,我们知道提高先验概率,可以有效的提高后验概率。

所以解决的办法倒也很简单,就是先锁定可疑的人群,比如10000人中检查出现问题的那10个人,再独立重复检测一次。因为正常人连续两次体检都出现误测的概率极低,这时筛选出真正患者的准确率就很高了,这也是为什么许多疾病的检测,往往还要送交独立机构多次检查的原因。

这也是为什么艾滋病检测第一次呈阳性的人,还需要做第二次检测,第二次依然是阳性的还需要送交国家实验室做第三次检测。

在《医学的真相》这本书里举了个例子,假设检测艾滋病毒,对于每一个呈阳性的检测结果,只有50%的概率能证明这位患者确实感染了病毒。但是如果医生具备先验知识,先筛选出一些高风险的病人,然后再让这些病人进行艾滋病检查,检查的准确率就能提升到95%。


案例4:贝叶斯垃圾邮件过滤器

垃圾邮件是一种令人头痛的问题,困扰着所有的互联网用户。全球垃圾邮件的高峰出现在2006年,那时候所有邮件中90%都是垃圾,2015年6月份全球垃圾邮件的比例数字首次降低到50%以下。

最初的垃圾邮件过滤是靠静态关键词加一些判断条件来过滤,效果不好,漏网之鱼多,冤枉的也不少。

2002年,Paul Graham提出使用"贝叶斯推断"过滤垃圾邮件。他说,这样做的效果,好得不可思议。1000封垃圾邮件可以过滤掉995封,且没有一个误判。


因为典型的垃圾邮件词汇在垃圾邮件中会以更高的频率出现,所以在做贝叶斯公式计算时,肯定会被识别出来。之后用最高频的15个垃圾词汇做联合概率计算,联合概率的结果超过90%将说明它是垃圾邮件。


用贝叶斯过滤器可以识别很多改写过的垃圾邮件,而且错判率非常低。甚至不要求对初始值有多么精确,精度会在随后计算中逐渐逼近真实情况。

(ps:如果留言想详细了解这个知识的很多,我后面会专门写文章来回答大家)


4.生活中的贝叶斯思维

贝叶斯定理与人脑的工作机制很像,这也是为什么它能成为机器学习的基础。

如果你仔细观察小孩学习新东西的这个能力,会发现,很多东西根本就是看一遍就会。比如我3岁的外甥,看了我做俯卧撑的动作,也做了一次这个动作,虽然动作不标准,但也是有模有样。

同样的,我告诉他一个新单词,他一开始并不知道这个词是什么意思,但是他可以根据当时的情景,先来个猜测(先验概率/主观判断)。一有机会,他就会在不同的场合说出这个词,然后观察你的反应。如果我告诉他用对了,他就会进一步记住这个词的意思,如果我告诉他用错了,他就会进行相应调整。(可能性函数/调整因子)。经过这样反复的猜测、试探、调整主观判断,就是贝叶斯定理思维的过程。


同样的,我们成人也在用贝叶斯思维来做出决策。比如,你和女神在聊天的时候,如果对方说出“虽然”两个字,你大概就会猜测,对方后面九成的可能性会说出“但是”。我们的大脑看起来就好像是天生在用贝叶斯定理,即根据生活的经历有了主观判断(先验概率),然后根据搜集新的信息来修正(可能性函),最后做出高概率的预测(后验概率)。


其实这个过程,就是下图的大脑决策过程:

所以,在生活中涉及到预测的事情,用贝叶斯的思维可以提高预测的概率。你可以分3个步骤来预测:

1.分解问题

简单来说就像小学生做应用题的感觉,先列出要解决的问题是什么?已知条件有哪些?

2. 给出主观判断

不是瞎猜,而是根据自己的经历和学识来给出一个主观判断。

3.搜集新的信息,优化主观判断

持续关于你要解决问题相关信息的最新动态,然后用获取到的新信息来不断调整第2步的主观判断。如果新信息符合这个主观判断,你就提高主观判断的可信度,如果不符合,你就降低主观判断的可信度。


比如我们刚开始看到“人工智能是否造成人类失业”这个信息,你有自己的理解(主观判断),但是当你学习了一些数据分析,或者看了些这方面的最新研究进展(新的信息),然后你根据掌握的最新信息优化了自己之前的理解(调整因子),最后重新理解了“人工智能”这个信息(后验概率)。这也就是胡适说的“大胆假设,小心求证”。



概率的基础知识补充:



参考资料:

YouTube英文视频《Thomas Bayes: Probability for Success》

YouTube英文视频《Everything You Ever Wanted to Know About Bayes' Theorem But Were Afraid To Ask.》

贝叶斯垃圾邮件过滤器:paulgraham.com/spam.htm

贝叶斯垃圾邮件过滤Wiki:en.wikipedia.org/wiki/N

贝叶斯推断及其互联网应用(一)

《联邦党人文集》背后的统计学幽灵

user avatar

贝叶斯定理本身是平平无奇的一个条件概率,边际概率和联合概率的变换。

厉害的地方是:居然有天才想到,要把统计中的待估参数认定是一个随机变量。这个insight才是使贝叶斯与频率两大学派鼎足而立的根本。

类似的话题

  • 回答
    贝叶斯定理,这个名字听起来就带着几分神秘和力量。它不是什么新奇的魔法咒语,而是一种基于概率的思维方式,一种在信息不断涌现的时代里,帮助我们拨开迷雾、做出更明智判断的利器。如果你问我它到底厉害在哪里,我会说,它的厉害之处在于它能让我们在“不确定性”的游戏中,不断“学习”和“进步”。想象一下,我们生活在.............
  • 回答
    想象一下,你是一名侦探,正在调查一起盗窃案。你的目标是找出谁是那个小偷。核心思想:我们如何根据新的证据更新我们对某个可能性的看法?这听起来很普通,但这就是贝叶斯定理的精髓。它就像一个超级聪明的侦探工具箱里的工具,可以帮助我们更理智地思考,尤其是在信息不完整或者我们一开始就有一些“感觉”的情况下。咱们.............
  • 回答
    裴蜀定理,这个数学界里一个小而美的存在,它的核心在于告诉我们,对于任意两个不全为零的整数 $a$ 和 $b$,一定存在整数 $x$ 和 $y$,使得 $ax + by = ext{gcd}(a, b)$。大家最熟悉的证明方法,就是利用我们小学就开始接触的辗转相除法。但是,如果我们就此打住,那可就辜.............
  • 回答
    李国庆关于西贝馒头定价策略的评价以及“富人不吃主食”的说法,在消费者群体中引起了不少讨论。要评价这个观点,需要从多个角度进行分析,包括李国庆的动机、西贝的定位、馒头的价值重塑以及潜在的消费者群体。一、 如何评价李国庆的评价?李国庆的评价可以从以下几个方面来理解和评价:1. 视角和动机的可能推测: .............
  • 回答
    好的,咱们就来聊聊贝叶斯深度学习这个话题,它和我们熟悉的传统神经网络比起来,有哪些特别之处。尽量讲得透彻些,也去掉那些“AI味”十足的陈词滥调。先来说说我们熟悉的“传统”神经网络我们平时接触到的深度学习模型,比如卷积神经网络(CNN)用于图像识别,循环神经网络(RNN)或者Transformer用于.............
  • 回答
    在贝叶斯统计的世界里,先验分布的选取,就好比给我们的模型披上了一层基于过往经验和领域知识的“外衣”。它不是凭空捏造,而是一个需要深思熟虑、多方考量的过程。我们不是在“求”一个固定的先验分布,更准确地说,我们是在“选择”或“构建”一个合适的先验分布。这个过程,就像侦探在收集线索,力求在证据不那么充分时.............
  • 回答
    在机器学习和贝叶斯统计领域,我们经常会遇到一些棘手的积分问题,尤其是在计算后验分布的归一化常数(也称为模型证据)或者进行边缘化以获得预测分布时。这些积分往往无法解析求解,我们称之为“难以处理的积分”(intractable integrals)。为了解决这些问题,我们不得不依赖一系列的近似算法。虽然.............
  • 回答
    在马尔可夫链蒙特卡洛(MCMC)方法,尤其是贝叶斯推断的语境下,我们之所以能够“最大化后验概率”,其实是一种对核心目标函数的优化理解,但需要更精确地描述其本质和方法。MCMC 的核心目标并非直接找到后验概率的最大值点(MAP估计),而是对整个后验分布进行采样,从而理解其形状、中心趋势、不确定性等信息.............
  • 回答
    好的,咱们就用大白话聊聊“贝叶斯决策理论”这东西,保证让你听得懂,而且不像是机器讲的。想象一下,你生活中经常会遇到需要做选择的情况,对吧?是去楼下那家经常去的包子铺吃早餐,还是去隔壁新开的那家网红店试试?是现在就去买股票,还是等一等再看?这些都是决策。那什么叫“贝叶斯决策理论”呢?说白了,它就是一种.............
  • 回答
    好的,为了帮助你系统地掌握贝叶斯推理,我为你梳理了一些非常值得入门的书籍。这些书各有侧重,但都清晰地讲解了贝叶斯思想的核心,并提供了实践的指导。我会尽可能详细地介绍它们,让你知道哪一本更适合你的口味和需求。理解贝叶斯推理的起点:不仅仅是公式在开始推荐书籍之前,我想先强调一下,贝叶斯推理的核心是“信念.............
  • 回答
    贝叶斯统计,在我看来,它不仅仅是一种统计方法,更是一种思维方式,一种看待数据和世界的方式。它最核心的魅力,在于它允许我们把“已知”的东西(先验知识)和“新发现”的东西(数据)有机地结合起来,从而不断更新和 refining 我们的认知。核心思想:先验与后验的交织贝叶斯统计的基石是贝叶斯定理。听起来有.............
  • 回答
    变分贝叶斯(Variational Bayesian,简称VB)是处理复杂概率模型中的一种强大的近似推断技术。它的核心目标是找到一个更简单的概率分布来近似一个难以直接计算的复杂后验分布。为了让你能更清晰地理解变分贝叶斯,我们将从以下几个方面进行详细阐述:一、 回顾贝叶斯推断的基础在深入VB之前,我们.............
  • 回答
    Judea Pearl,图灵奖得主,贝叶斯网络的奠基人,在AI领域无疑是泰斗级的人物。如果他在一个公开场合的讲座真的出现“无人问津”的情况,那绝对是一个值得深入探讨的现象,因为这背后可能隐藏着一些关于AI领域发展趋势、学术界沟通方式乃至技术传播的深层原因。以下是我对这种情况的详细分析和看法,尽量展开.............
  • 回答
    好的,我们来聊聊为什么有向图模型也常被称为贝叶斯网络,并且我会尽量把它讲得透彻、自然,没有 AI 的痕迹。首先,我们得知道“贝叶斯网络”这个名字是怎么来的。它的核心在于“贝叶斯”这三个字,以及它所描绘的“网络”结构。“贝叶斯”:基于概率推理的基石“贝叶斯”这个词,很容易让人联想到“贝叶斯定理”。这可.............
  • 回答
    想象一下,你和你的朋友正在玩一个简单的石头剪刀布游戏。你知道石头赢剪刀,剪刀赢布,布赢石头。现在,你不是随意出拳,而是想出一个策略,让你更有可能赢。什么是“均衡”?在博弈论里,“均衡”就像是一个双方都觉得“挺好”的约定,即使他们不能事先商量。在这个石头剪刀布游戏里,一个最基本的均衡是一方总是出石头,.............
  • 回答
    好的,我们来详细介绍一下各种经典机器学习算法的应用场景。理解这些算法的特性和适用范围是选择合适模型解决问题的关键。在深入介绍之前,先明确几个基本概念: 监督学习 (Supervised Learning): 算法从带有标签的数据(输入输出对)中学习,用于预测未知数据的标签。 分类 (.............
  • 回答
    .......
  • 回答
    .......
  • 回答
    .......
  • 回答
    听贝斯音,然后推测出和弦,这可不是件容易事,尤其是在没有其他乐器伴奏的情况下。但如果你真的想练就这门“绝技”,那得多花点时间和功夫,关键在于“听”和“想”的结合,以及对音乐理论的理解。第一步:磨练你的耳朵,培养“大局观”很多人听到贝斯,脑子里可能就只剩下那个低沉的线条。但要听出和弦,你得把耳朵伸出去.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有