湘桥农业网
社会新闻 当前位置:首页 > 社会新闻 > 正文

谜一样的概率权

这个世界只给了我一个小角落。

Part A

A1的故事源于一段恋情。当写关于“贝叶斯推论”的时候,《醉汉的脚步》提到了一部有趣的电影:一个律师,一份好工作,一个迷人的妻子和一个幸福的家庭。他爱他的妻子和女儿,但仍然觉得生活中似乎缺少了一些东西。一天晚上,当他坐火车回家时,他瞥见一个美丽的女人,带着深思的表情凝视着窗外的舞蹈课。第二天晚上,他的眼睛跟着那个女人。第三个晚上也是如此。每次他的火车经过舞蹈班时,他都会被爱的魔力深深吸引。最后,一天晚上,他冲动地跳下车,报名参加舞蹈班,希望能见到这个女人。到目前为止,这一切都像是一部美国电影,但是后来,绘画风格改变了,变成了一部法国电影。

但是当遥远的目光变成面对面的对立时,她难以忘怀的吸引力逐渐消失了。他确实爱上了她:不是和她,而是和跳舞。他对家人和同事保密这种不理智的感觉,并为他越来越多的离家之夜寻找各种借口。最后,他的妻子发现他并不像声称的那样经常工作到很晚。妻子认为他更有可能有外遇,并在下班后撒谎掩盖他的行踪,而不是因为外遇而撒谎。因此,她的结论是她丈夫有外遇。作者写道:这个结论肯定是错误的,但她的错误不仅仅是这个结论,而是整个推理过程本身。她混淆了丈夫偷情时偷偷摸摸的可能性和丈夫偷情时偷情的可能性。上面提到的两种概率之间的本质区别是什么?这个故事和贝叶斯有什么关系?

让我们来谈谈贝叶斯定理:如果100%患有x的病人都有某些症状,并且有人也有相同的症状,那么他患x的可能性有多大?这实际上是上述电影故事的变体。人类的直觉会告诉我们,他极有可能(80%-100%的概率)得X疾病。事实并非如此,我们还需要考虑先验概率。假设X疾病的发病率为十万分之一,世界上具有相同症状的人的发病率为十万分之一,此人患X疾病的概率仅为十分之一,90%可能为假阳性。让我们绕过这个问题,摆脱这个概念,找到一些有趣的东西。A2概率能有所帮助吗?让我们讲一个真实的故事。很遗憾这次救了一个坏人。这是着名的辛普森妻子谋杀案。

辛普森是美国足球明星和演员。?恢缚卦?1994年犯有两起谋杀罪。受害者是他的前妻和她的好朋友。此案被称为美国历史上最受公众关注的刑事审判。辛普森在长达九个月的马拉松审判后被判无罪,这次审判创下了加州审判的纪录。虽然警方在案件现场收集了大量证据,包括血手套、血迹和现场的脱氧核糖核酸测试,但辛普森似乎逃脱不了被定罪的命运,但辩护律师通过各种方法逐一解决了这些问题。这涉及到一个概率问题。辛普森高价聘请了顶尖律师,包括哈佛法学院教授艾伦。众所周知,在美国400万受虐待的妻子中,只有1432名被丈夫杀害。所以:辛普森杀死妻子的概率只有1432/400万,或者说是2500分之一。因此,辛普森杀害妻子的概率很低,也就是说,辛普森几乎不可能杀死他的妻子。辩护听起来很合理,检察官目前无法反驳。

有什么问题?让我用直观的方式分析一下。首先看下面的图片。蓝色圆圈代表美国400万受虐待的妻子。红色圆圈代表1432名妻子被丈夫杀害。律师的逻辑似乎没有错。从图中可以看出,虐待妻子的丈夫中只有一小部分(即1/2500)谋杀了妻子。如上所示,1/2500是“红色区域/蓝色圆圈区域”的结果。

然而,律师秘密地改变了这个概念。如果你看下图,蓝色圆圈代表美国400万受虐待的妻子,红色圆圈代表被丈夫杀害的1432名妻子。这里添加了一个绿色圆圈。信息如下:因为我们谈论的是被谋杀和虐待的妻子,绿色圆圈被包括在蓝色圆圈中;因为并非所有被谋杀的妻子都被丈夫杀害,所以红色圆圈包含在绿色圆圈中,“问号”部分表示那些被丈夫谋杀和虐待的妻子。听着,即使你不知道凶手是谁,辛普森的妻子应该在哪个圈子里?这是一个绿色的圆圈。因此,辛普森是凶手的概率应该除以红色区域和绿色区域。律师的诡计是什么?他用蓝色代替绿色,“红色/蓝色”的错误概率是1/2500,“红色/绿色”的真实概率被替换。那么,真正的概率是多少?据统计,高达90%!就是这么简单的“伎俩”,居然欺骗了法庭!我们的大脑和直觉怎么了?A3也许检察官应该知道贝叶斯公式。贝叶斯定理是一个关于随机事件a和b的条件概率的定理。这个公式非常简单。简单描述一下:

让我们暂停一下,从头开始看下面的概念。

(以下部分来自维基百科。)概率是数学概率论的一个基本概念,一个介于0和1之间的实数,是随机事件概率的度量。对大多数人来说,理解概率的评估方式以及概率和决策之间的关系是很重要的。先验的:在拉丁语中,它指的是“从以前的事物”或延伸到“经验之前”。在现代西方传统中,先验是指没有经验或在经验之前获得的知识。它通常与后验知识相比较。后验:在“经验”之后,即“需要经验”。这种区分来自中世纪逻辑区分的两种论证:从原因到结果的论证被称为“先验的”;从结果到原因的争论被称为“后验”。先验知识不依赖于经验,例如,数学公式22=4;恒珍的主张“所有单身汉都不能结婚”以上两者都是先验知识,因为它所表达的只能来自理性。后验不能仅仅基于理性,例如,“乔治五世统治于1910年至1936年。”这是后天的知识。认识论的基本问题之一是:有什么重要的先验知识吗?一般来说:理性主义者相信先验知识的存在;经验主义者认为所有的知识都来源于某种经验(通常是外部经验)。休谟在《人类理智研究》中多次提到,所有先验知识只是概念之间的关系。先验概率。它指的是从过去的经验和分析中获得的概率,在“从原因中寻求结果”的问题中,这通常被视为“原因”。例如,哈佛律师说1/2500是一个(错误的)先验概率。后验概率。它是指在获得“结果”信息后修改的概率,是“通过持有结果找到原因”问题中的“结果”。回到贝叶斯公式。甲和乙是两个随机事件,它们之间有重叠。示意图如下:蓝色圆圈代表出现的概率,红色圆圈代表出现的概率,中间重叠的绿色部分代表同时出现的概率,我们标记如下:

让我们试着推导贝叶斯定理。这个过程太简单了,不容置疑,但我强烈建议你找张纸自己画。对于小学生来说,是一个简单的小把戏吗?没错。

然而,这是一个如此大的骗局,辛普森的律师在法庭上耍了一个魔术,扭转了局面。

让我们再用贝叶斯定理来推理。律师谈论的条件概率基于以下两个事件:事件A1:妻子被虐待;事件B1:妻子被丈夫杀害。因此,当妻子被丈夫虐待时,被丈夫杀害的有条件概率是P(B1|A1)。

律师给出的数字是1/2500。如上所示,P(B1|A1)=1/2500,即“红色区域/蓝色区域”。然而,律师秘密地改变了这个概念。事实上,已知的情况是妻子被虐待致死(原因不明)。我们真正应该讨论的条件概率应该是:概率是多少

B2:凶手是她的丈夫。(红色块中的区域)所以正确的计算应该是:P(B2|A2)=红色区域/绿色区域。你发现哈佛律师的诡计了吗?在分母部分,他用一个大的蓝色区域代替了一个非常小的绿色区域(美国有400万受虐待的妻子),从而大大降低了辛普森犯错的概率。这相当于悄悄地改变先决条件,也就是说,制造一个有条件的概率谎言。事实上,据统计,市盈率(B2|A2)约为90%。这意味着辛普森成为杀人犯的概率高达90%,而不是1/2500。律师改变了辛普森的概率权利。概率正确是我创造的一个词。概率权重=概率计算选项。例如,对辛普森来说,他谋杀嫌疑人的概率(负值)是90%,而不是1/2500。例如,有些人宁愿追求比被闪电击中的概率更小的获胜机会,也不愿做有50%成功机会的事情。在本文中,概率权重还有另一个含义:全知者对概率的分配权。例如,流量、知识产权等实际上是平台概率分布游戏的幕后黑手。在贫富差距的关键决策点上,“穷人”放弃了他们的概率权益。A4贝叶斯公式的确非常简单,但是辛普森一案告诉我们,如果一件简单的事情能够迷惑很多聪明人,那就意味着这件事情并不简单。有趣的是,当我写辛普森一案时,我发现了两篇主要文章。虽然这个案例的来源都是英语材料,但其中一个是“错误编译”的。我们的大脑不是为概率而设计的,尤其是当两个以上不同的概率叠加在一起时。你没有贝叶斯直觉概念的原因是,一方面,这个概念简单但不直观,另一方面,人们很少有意识地使用这个公式来解决生活中的问题。让我们来看一个有趣的问题:醉汉要去哪里?

一个酒鬼90%的时间出去喝酒,只随机(概率相等)到三个固定的酒吧喝酒,也就是说,去每个酒吧的概率是30%。今天,警察试图抓住醉汉,但他们找到了两个酒吧,却没有抓住他们。请问:在第三个酒吧喝酒的可能性有多大?答案是:如果警察真的想逮捕醉汉,那么醉汉在第三个酒吧的概率是75%;如果警察是酒鬼的兄弟,不想逮捕他那么多,酒鬼在第三个酒吧的概率是90%。关于酒精问题最令人困惑的是:“为什么警察“真的”和“假装”逮捕酒精中毒者会影响酒精中毒者在第三个酒吧的概率?也就是说,第三个酒吧里的酒鬼是一个身体事件,在警察逮捕他们之前客观存在。为什么警察的主观意识发生了变化?

有心灵感应这种东西吗?请允许我用小白语来分析这个话题:“酒鬼去每个酒吧的概率是30%,这是一个统计结果,也就是说,在过去的100天里,酒鬼去了酒吧A 30天,酒吧B 30天,酒吧C 30天,老婆骂他们回家10天。所以具体到今天,他要么在三个酒吧之一,要么在家。不管他在哪里,他都百分之百在那里。在这种情况下,概率有什么用?用来分析可能性。例如,知道概率的大小,警察知道在任何酒吧抓到一个酒鬼的概率是在家抓到他的三倍。一次可能不准确,但很多次,越来越接近这个比例。然而,由于不知道醉汉现在在哪家酒吧,他在酒吧A的30%概率是“先验概率”。

让我们看看“先验概率”:在贝叶斯统计中,某个不确定性p的先验概率分布是在考虑“观测数据”之前能够表达p不确定性的概率分布。它旨在描述这种不确定性的不确定性,而不是这种不确定性的随机性。换句话说,在没有“观测数据”之前,我们只能把酒鬼的概率计算为“先验概率”。既然有先验概率,那么当然也有后验概率:

在贝叶斯统计中,随机事件或不确定事件的后验概率是在考虑并给出相关证据或数据后获得的条件概率。类似地,后验概率分布是基于实验和研究之后获得的概率分布的未知量(被视为随机变量)。这里的“后验”代表对测试事件相关证据的考虑。在酒鬼这个话题上,请允许我用小白翻译先验概率和后验概率。如前所述,在任何一个酒吧酗酒的概率是30%,在三个酒吧酗酒的概率是90%。

警察突袭了酒吧甲和酒吧乙,这是一个“观察数据”的过程。然而,只有当警察真的想抓住小偷时,他们才能被视为有效的“观察数据”。

如果警察故意想放过醉汉,那么这个“观察数据”过程就是作弊,是无效的。首先,警方真的很想抓到醉汉(不知道醉汉在哪里):因为他们没有被连续抓到两个酒吧,通过这样的调查,我们实际上想更新酒吧里醉汉的概率。根据贝叶斯公式,计算如下:这是一个简化的计算,以减少阅读损失。如前所述,后验概率分布是基于实验和研究后获得的概率分布的未知量(被视为随机变量)。在调查了酒吧a和酒吧b之后,警方得到了75%的后验概率。

再看看警察,他们不想抓醉汉(并且知道他们在哪里):如果醉汉在酒吧c,警察会故意选择去酒吧a和酒吧b;如果醉汉在家被妻子责骂,警察会随机选择两个酒吧检查。

总之,因为没有真正的“观察数据”,酒吧里酒鬼的总概率仍然是先前概率的90%,而先前概率只集中分布到酒吧C。如果你用一个不专业但更直观的说法,那就是:当警察真的想抓住(不知道醉汉在哪里)时,他通过酒吧a和b的“数据测试”更新了酒吧里醉汉的总体概率。这是75%的来源。当警察真的想抓到(并且知道醉汉在哪里)的时候,他并没有通过去酒吧a和酒吧b的“数据操纵”来改变酒鬼在酒吧的总体概率,而是把其中的90%分配给了酒吧c。逮捕酒鬼的案例告诉我们:“判断是可以衡量的,相关性的判断是概率。”然而,这个问题经常出现在“相关性判断”中。同样,醉汉被抓住的可能性似乎已经被知道这件事并想保护他的警察控制住了。这也是一个概率正确。A5一位朋友说:如果你能结合一些与生活密切相关的问题,解释贝叶斯定理,并谈论如何应用它,慢慢地我就会习惯用这种思维来解决问题。事实上,我们的大脑一直在使用贝叶斯定理。《嫌疑犯X的献身》是东野圭吾的长篇推理小说,讲述了一个自嘲的数学天才“石申”帮助母女逃脱过失杀人罪的故事。3月10日,警察问这对母女在“案发当晚”在哪里。女主角回答说她先去看电影,然后去KTV。警察离开后,他准备教女英雄如何处理为爱而死的男英雄的调查。他对她说:

因为你熟悉小说和电影,你应该知道还有一个物理天才“汤川研究”(Yukawa Studies),他扮演的是数学天才的对立面。他终于破解了数学天才“石神”设置的难题。其中,在讨论嫌疑人的电影票时,汤川向警方询问票根:让我们简化一下场景:如果这对母女确实在3月10日晚上误杀了人,并打算用他们找到的票根欺骗警方,那么石申为什么要他们做以下事情?1、未主动拿出票根的;2.当警察要求时,他们假装不确定自己能找到它。3.剪辑电影简介中的短截线。除了表演和投掷烟幕弹,这背后还有什么数学原理吗?A6Matrix67在博客中做了类似的分析。他的故事是他的室友昨晚可能去报到了,但是他辩解说他实际上是在看电影。有人向他要电影票,但他拒绝了。他花了很长时间才知道。如果他真的去报到了,那么他在概率论方面真是个好骗子。这个故事非常相似。用贝叶斯定理分析矩阵67。如果事件a等于“同学m要签到”,事件b等于“同学m有电影票”, 让我们来看看公式中每个概率的含义:p (a):同学m昨晚签到的概率p (b):同学m手里拿着电影票的概率P(A|B):同学m在他手里的电影票被发现后昨晚签到的概率P(B|A):如果同学m昨晚真的去签到了, 手里拿着电影票的概率m想用电影票做伪证,也就是说,让室友在心里想P你还记得以前的贝叶斯定理吗,那就是:P(A|B)=P(B|A),p (a)/p (b),因为同学m的目的是让P(A|B)的值变小。 从上面的公式中,我们可以看到通过减少等号右边的p (b | a),也就是说,如果同学m昨晚真的去签到(活动a),他手里就会有一张电影票(活动b)。如何做到这一点?不要轻易给出证据(上面提到的策略)。故意表现得不能够提供证据使人们越来越相信在事件A之后提供证据B的可能性非常小。我猜你可能不满意上面的解释,所以我将继续展示我丑陋但直观的插图。如上图所示,小朋友们实际上表达了对黄色区域的怀疑(当他们真的开了一个房间的时候买票),所以M学生所要做的就是压缩黄色区域的面积。事实上,在我的朋友们中间,我内心深处有一种怀疑(贝叶斯定理中被称为“信念”):如果你去办理登机手续,你也可以得到一张假机票。这并不难。请注意,这一假设实际上暗示了小伙伴对“即使在开房时也能买到假票”的概率预期那么,假装没有票根然后再拿出来有什么用呢?让我们还是看着照片,谈谈吧。有两个优点:1 .通过弱点,让小伙伴调整自己的信念“你看,拿到假票根并不那么容易”,从而降低了小伙伴对“开房也能拿到假票根”难度的概率预期,即减少了上图中黄色区域的面积;2.注意到一开始我没有找到票,他加强了他的小伙伴的假设“你看,你一定是去签到了!”这时,小朋友们被介绍到上图中红色圆圈的左侧,即“真正的房间,没有票”。然后,突然又无意中发现了这张票,会让小伙伴们突然产生更大的差距,觉得自己开始猜测一切都是错的。例如,你认为一桶冷水是热的吗?也就是说,把你的手放在一桶更冷的水中,然后把手放回去,你会感觉到这桶水变热了。这个比喻有点令人费解,但确实很准确。事实上,我们对“一个对自己不好的人”的良好行为的看法往往比“一个对自己好的人”的看法更强烈。这是魔术师的秘密:通过改变期望值和改变视线来改变基本概率和条件概率。你仍然认为贝叶斯定理没用吗?说谎是人类社会最重要的基本能力之一。伟大的说谎者实际上是贝叶斯专家。即使你不理解这个公式,你已经很好地使用了它。那些心理学的

让我们看看电影中的贝叶斯推理。(以下案例的英文来源:布兰登罗勒)

你在电影院排队看电影。前面有一个小伙伴,留着长发,披着披肩,穿着中性衣服。如上所示,助教是女性的概率是多少?案例A

我在《生命、宇宙以及任何事情的终极答案》中介绍了一种类似的计算方法。上图是可视化贝叶斯计算方法,将在《统计学关我什么事》中详细解释。请注意上面绿色和黄色的两个矩形:1。“面积”的概念在贝叶斯概率的计算中起着重要的作用。2.事故的可能性有绿色和黄色两种。两者各自的概率反映在矩形的宽度上。例如,在上图中,假设男女比例为1:1。3.矩形的高度是指“可能的世界”的可能组成。例如,在上图中,绿色矩形指的是女性的可能世界,而可能世界由假定的“一半长发和一半短发”的比例组成。了解面积法后,计算从以下步骤开始:步骤1:首先,假设剧院100人中有50名男性和50名女性。贝叶斯计算的特点是主观预测和总体估计。第二步:假设一半的女性留长发,其余25名留短发。男性中,48人留短发,2人留长发。这也是基于常识和主观预测的粗略估计。第三步:从这里,我们可以计算出有25名长发女性和2名长发男性。步骤4:因此,助教是女性的可能性是“25/(25 ^ 2)=92.6%”。让我用一种更简单、更直观的方式来描述计算过程:

还记得我在《为什么真正聪明的人都是概率高手?(零公式入门篇)》中提到的平行宇宙方法吗?

这是一个类比吗?不是全部。稍后我会解释,在这里我继续冒着被聪明人嘲笑的风险,用平行宇宙方法代替贝叶斯公式来重现上面的计算过程:

步骤1:假设“未知的未来”由100个平行宇宙组成。

假设电影院一半是男性,一半是女性(这是粗略估计的先验概率),那么,在100个平行宇宙中,50个是男性,50个是女性。步骤2:进一步“分裂”50男50女的平行宇宙。继续常识(头发估计的另一个先验概率),男人很少留长发,而女人各留一半。

步骤3:根据观测数据关闭不合理的平行宇宙。根据实际观察,前面的那个有长头发,所以不符合这个特征的平行宇宙将被关闭。下图被黄线划掉了。

步骤4:重新计算现有平行宇宙的分布概率。如下图所示,剩余平行宇宙的分布如下:,这突然成为一个非常简单的概率问题。

还有27个平行宇宙,女性占25个,所以女性领先的概率是25/27。现在让我们添加一条新消息。你在排队等候进入男士休息室。依靠这些额外的信息,常识和背景知识就可以用来判断助教。助教更可能是没有思考的男性。然而,贝叶斯推理能够以数学实现的形式做出更准确的预测。重要的是,当你看不到你可以简单地通过常识和直觉做出定量判断时,你需要精确的算法。因此,让我们继续使用贝叶斯计算如下:

如上所示,或者使用面积计算方法开始推理:第一步:100人在男洗手间外排队。我们进行主观猜测和估计,其中98人是男性,2人是女性。上图中的绿色矩形非常“薄”,因为女性很少。第二步:假设一半的女性留长发,一半留短发。每50个人中就有两个人留着长发。与上述情况一样,这也是基于常识和主观预测的粗略估计。我们注意到,尽管男性长发的比例很低,但由于人口基数大,用来计算男性长发数量的矩形(深黄色)是“胖”,多达四根。第三步:根据以上假设,有94名短发男性和4名长发男性。而两位女士留着长发和短发。也就是说,长发人群中有4男1女。步骤4:助教成为女性的可能性是20%。我们也可以用我所说的平行宇宙方法来计算

这里再次出现了上面提到的两个概念:1。先验概率。例如,在长发是男性或女性的情况下,根据常识,假定人口的总性别比例为1:1。2.后验概率。由于知道队伍在男休息室前面,根据这一信息,人群中的男女比例被调整为98:2。因为前面的人被观察到有长发,所以短发的平行宇宙是封闭的,概率分布被更新。

这个过程叫做贝叶斯推理。贝叶斯推理可以总结如下:通过观察行为(信息),先验概率通过贝叶斯更新并转换为后验概率。这个后验概率可以成为下一个推论的前验概率。例如,“地球是圆的”,这是先验知识还是后验知识?

有些人说“地球是圆的”这句话是当每个人都认为地球是平的时候的后知后觉。在现代人的眼里,每个人都知道地球是圆的,是先验知识。贝叶斯推理,就像一个进化的引擎。贝叶斯算法因其学习功能而在人工智能时代辉煌一时。在贝叶斯推理中,所有信息都被用于修正后的“每个类别的后验概率”。也就是说,我们可以把它看作是“从信息中学习的结果”。贝叶斯推理具有“自动收集信息和变得智能”的功能。

A8你还记得本文开头的电影吗?

是时候说:“她丈夫有外遇时偷偷摸摸的可能性”和“他丈夫偷偷摸摸时他作弊的可能性”。这两者有什么区别?让我们回顾一下贝叶斯公式非常强大的真实场景:(这个案例来自维基百科。)假设常规检测结果的灵敏度和特异性为99%,即吸毒者每次检测呈阳性()的概率为99%。然而,每次测试中非吸毒者阴性(-)的概率为99%。从检测结果的概率来看,检测结果相对准确,但是贝叶斯定理可以揭示一个潜在的问题,几乎每个第一次看到这个问题的人都会有一些意外。假设一家公司对所有员工进行药物滥用测试,已知0.5%的员工使用药物。每个测试呈阳性的员工滥用药物的可能性有多大?让“D”成为员工吸毒事件,“N”成为员工非吸毒事件,“成为阳性测试事件”。可用:P(D)代表员工吸毒的概率,无论其他情况如何,该值为0.005。因为该公司的预统计数据显示,其员工中有0.5%吸毒,所以该值是d. P(N)的先验概率,代表员工不吸毒的概率。显然,这个值是0.995,也就是1-P(D)。P( |D)代表吸毒者被检测为阳性的概率,这是一个条件概率。由于阳性检测的准确度为99%,因此该值为0.99。P( |N)表示非药物使用者被检测为阳性的概率,即错误检测的概率,该值为0.01。由于非药物使用者的阴性检测概率为99%,因此假阳性检测概率为1-0.99=0.01。p()代表阳性检出率,不考虑其他因素的影响,简单地说,就是说,公司的测试结果中阳性的比例。该值为0.0149或1.49%。我们可以通过全概率公式来计算:这个概率=成为吸毒者的概率x被检测为阳性的概率(0.5% x 99%=0.495%),不成为吸毒者的概率x被检测为阳性的概率(99.5% x 1%=0.995%)。P( )=0.0149是阳性检测的先验概率。根据上面的描述,我们可以计算出一个人在检测呈阳性时确实服药的条件概率p (d P(D| ): 。虽然药物检测的准确率高达99%,贝叶斯定理告诉我们,如果有人检测呈阳性,服药的概率只有33%左右,不服药的概率相对较高。如果假阳性率高,测试结果不可靠。这是因为该公司的非吸毒者人数远远大于吸毒者人数,所以即使非吸毒者被误检阳性的概率只有1%,实际误检人数仍然非常大。总而言之,一个人吸毒并被检测为阳性的概率与

你给一个随机事件一个“先验概率”,然后用新的证据来修正它以获得一个“后验概率”。然后你把这个“后验概率”变成一个新的“前验概率”,并再次修正它.例如,你看到一个人在街上摆摊,和路过的人玩抛硬币游戏。你冷静地看了一会儿,发现他连续八次领先。不懂概率的傻瓜会说:哇,积极的运气是如此强大,我敢打赌积极!那些坚信“赌徒谬论”的人会说:下次反过来的可能性会增加!一个懂概率的书呆子会说:愚蠢!根据大数定律,下次的概率是正数还是50%!然而,这三个都是错的。前两个人的错误不值得一提。我们将关注理解概率的书呆子哪里错了。在街上这种“环境条件”下,我们有理由怀疑扔硬币的商人作弊了。如果我们继续观察并采用贝叶斯算法,我们就可以计算出硬币面朝上作弊的概率。《统计学关我什么事》对贝叶斯定理给出以下描述:主观和客观概率是一个客观概念。答案是独特的。例如,如果你扔一枚标准硬币,面朝上的概率是50%。

贝叶斯定理中提到的“概率”是“主观概率”。解释是:你心中所描绘的“信仰程度”的概念。换句话说,这不是“概率是多少”的问题,而是应该理解为“你认为概率是多少”。总经理概率贝叶斯推理的优点是“在任何情况下,都可以获得暂时的结果”。然而,这一结果并没有像内曼-皮尔逊统计那样得出单方面的判断(不是A或B),而是认为两种可能性都存在,并给予这两种可能性一个相应的比例关系,仅此而已。因此,贝叶斯推理实际上需要一个“代理人”,他需要一个基于信念的初步判断,通过观察,然后更新判断。贝叶斯推理也经常被称为“总经理的概率”最大似然原则是,世界上正在发生的事情之所以发生,是因为它的概率很高。在学习功能贝叶斯推理时,所有信息都被用于修正后的“每一类的后验概率”。也就是说,我们可以把它看作是“从信息中学习的结果”。贝叶斯推理具有“自动收集信息和变得智能”的功能。

有了“人性”的功能,大脑如何工作仍然是个谜。例如,为什么孩子们学得这么快?为什么机器必须学习数千万张图片才能识别猫?但是这个孩子会认出它一次,而且他几乎一辈子都不会忘记它,他也不会错。正如我们判断一个人一样,我们不断重复“信息”->“修改印象”->“遗忘信息”的过程,逐渐形成对这个人的固定评价。通过逐渐“改变印象”获得的结果和“通过迄今为止的所有观察一次形成的印象”之间没有太大的偏差。因此,我们没有必要总是“从白皮书开始思考”,这会耽误很多时间和精力。贝叶斯推理,事实上,就像我们每天做的“印象修正”和“学习”,但只使用系统的数值进行计算。相反,贝叶斯推理也能使我们在信息不足的不确定环境中思考、决策和行动。像A0贝叶斯公式这样的计算可以让我们对一些简单的真理有更深的理解。只有当一个人洞察到潜在的原则,真理才能被称为真理,否则它与鸡汤没有什么不同。

这样,我们就能理解为什么达利欧说:参与快速学习的反馈回路是一件令人兴奋的事情。直到那时,我们才明白“重新设置、飞轮、更新和升级”的价值和意义。如果我们只从二维的一段时间来看贝叶斯公式,它实际上只是一个简单的四规则运算。然而,在增加了这个时间维度之后,切片之间的联系就建立起来了,魔法就出现了。这是一个连续的循环。贝叶斯的神奇之处在于,当你主观地设定先验概率时,你不需要那么精确。在我和一些养牛人接触的过程中,我发现他们并不比其他人聪明。当他们接触到新事物时,由于他们的普通才能,他们往往不能有一步到位的判断。你甚至可能想知道为什么这家伙这么普通,有这么多。芒格在他的演讲中曾经说过:许多人在晋升测试或快速计算方面非常精明,但是他们一个接一个地犯愚蠢的错误,仅仅因为疯狂的想法不断出现在他们的脑海中。尼采曾经说过:“总会有人为自己的跛足而自豪。”如果你经历过失败,不想后悔,你会以自己的方式滑向浅薄。嫉妒、太多的自怜、极端的想法和强烈的忠诚都是你已经失去理智并将被锤子敲打的明显迹象。此外,芒格分析了巴菲特非凡成功的奥秘:决定性因素是沃伦是世界上最好的连续学习机器。乌龟最终打败兔子是不断努力的结果。一旦你停止学习,整个世界都会从你身边呼啸而过。像巴菲特这样的人有强大的贝叶斯大脑。讽刺的是,孩子天生就有生动的贝叶斯大脑,但是我们通过刷问题把他们变成机器。你想年轻而不老吗?在过去的两年里,一种名为“二甲双胍”的神奇药物已经悄然传播开来。

起初,它是世界上使用最广泛的降血糖药物之一。它最重要的功能是治疗糖尿病。它是治疗2型糖尿病的首选药物,也是第一种被证明可以预防糖尿病或延缓其发生的药物。后来,人们发现这种东西也可以减肥。后来,人们发现它也能抗癌。人们还发现二甲双胍也能延缓衰老.不管怎样,我知道许多聪明贪婪的朋友都在悄悄地吃这种东西。(听医生的,不要吃药。)为什么神奇的药物如此强大?

有些机制我们知道,有些我们还不知道。事实上,这种现象在医学领域非常普遍。尽管许多药物已经得到监管机构的批准并被广泛使用,但实际上没有人知道它们是如何工作的。例如,阿司匹林于1897年问世,但直到1995年,才有人真正解释它是如何工作的。《纽约客》年的一篇文章称这种方法是在解释“智力债务”之前找到答案的。作者认为人工智能的新技术增加了我们的“智力债务”。以前,知识债务主要限于医疗和其他领域。随着新的人工智能技术,特别是机器学习的出现,我们的“智力信用额度”已经提高。机器学习系统越来越擅长解决一些难以置信的模糊和开放问题。他们认识到数据海洋中的模式,但没有发现因果机制。正如“贝叶斯网络之父”朱迪亚珀尔担心的那样,机器学习系统只告诉人类结果,而不解释原因。人类智能和人工智能之间的差距越来越大。B2:这种智力债务与贝叶斯定理有关。

故事从第一次人工智能浪潮的危机开始。20世纪80年代,人工智能领域的研究遇到了困难。“人工智能的主导机制一直是所谓的基于规则的系统或专家系统,它将人类知识组织成一组具体事实和一般事实,并通过推理规则将两者联系起来。例如:苏格拉底是一个人(具体事实)。每个人都会死(一般事实)。从这个知识库中,我们(或智能机器)可以使用通用推理规则来推断苏格拉底会死的事实,也就是说,如果所有的A都是B,那么X就是B。”然而,面对复杂的现实世界,专家系统很难从不确定的知识中做出正确的推理。 《为什么》的作者朱迪亚珀尔(Judea Pearl)在20世纪80年代初开始研究人工智能。他发现他把概率视为常识的“守护者”,专注于修复它的计算缺陷,而不是从头开始创建一个新的不确定性理论。更具体地说,我们不再像以前那样使用一个巨大的表来表示概率,而是使用一个松散耦合的变量网络来表示概率。受到神经网络先驱大卫鲁姆哈特(David Rumehart)的启发,朱迪亚珀尔坚信,人工智能必须以模拟我们所知的人类神经信息处理过程为基础,不确定性下的机器推理必须借助类似的信息传输架构来构建。后来,他终于意识到信息是一个方向的条件概率和另一个方向的似然比。因此朱迪亚珀尔创立了一种关于不确定性的推理方法:“贝叶斯网络”。贝叶斯网络用于模拟理想化和分散化的人脑将概率纳入决策的方法,它可以根据我们观察到的一些事实快速计算出其他一些事实是真还是假的概率。正如我们之前看到的,这是简单贝叶斯定理的难以置信的优势。朱迪亚珀尔使贝叶斯网络成为机器学习的实用解决方案。因此,他被称为贝叶斯网络之父。贝叶斯网络就像信息时代的神话。例如,我们使用的4G手机使用的纠错算法是加拉格尔的涡轮式代码。由于编码和解码是手机最耗能的部分,使用新编码的手机的能耗大大降低。灵感来自一位名叫贝鲁的法国工程师,他起初没有意识到自己使用的算法与贝叶斯网络相同。贝叶斯网络在人工智能领域很受欢迎,被认为是人工智能不确定性推理的主导范式。从最早的计算机开始,计算机就被用来解决精确的计算问题。我仍然记得日本顶尖棋手石田芳夫(Fangfu Ishida)在上世纪80年代末开始学习围棋时的绰号是“电子计算机”,这意味着他的计算非常准确。另一方面,贝叶斯网络使计算机能够在“灰色区域”思考。这有点像物理学被逼入绝境时量子力学惊人的飞跃吗?概率,这个幽灵般的数字,在20世纪的开始和结束,帮助人类打开了一片陌生的天空,也把人类带入了一个日益未知的世界。B3贝叶斯定理看起来像一条简单的规则:“当你收到新的论点时,它被用来改变你对假设的信任。

如果论点与假设一致,假设的概率就会增加;相反,它会下降。通常我们思考一个问题,是先给出原因,然后再找到结果。贝叶斯定理的价值在于它可以帮助我们“从结果中寻找原因”。18世纪神秘的牧师托马斯贝叶斯这样表达了他简单而伟大的思想:“考虑到未知事件发生的次数和失败的次数,在实验中找出事件发生概率在两个已知概率之间的概率。”谁会想到这样一个简单的公式会成为统计学和机器学习的基础?书《终极算法》介绍:朴素贝叶斯算法(Naive Bayesian algorithm)是一种学习算法,可以用短方程来表达。只要提供患者病历的数据库,包括患者的症状、检查结果,或者他们是否有任何特殊情况,朴素贝叶斯算法就可以在一秒钟内做出诊断,而且往往比那些在医学院学习了几年的医生要好,甚至可以击败花费数千小时构建的医学专家系统。该书的作者佩德罗多明戈斯(Pedro Domingos)提出了一个假设:所有的知识,无论是过去的、现在的还是未来的,都可以通过单一的通用学习算法从数据中获得。这就是所谓的“终极算法”。为了证明这种观点的可能性,作者提到了统计学派的观点:所有形式的学习都基于一个简单的公式贝叶斯定理。在最初几个简单但令人困惑的计算中,我们学到了贝叶斯定理的诀窍:每当你看到新的证据时就更新你的想法。在此基础上,贝叶斯学习算法对世界做出一系列假设,从而开始学习。当它看到新数据时,与数据匹配的假设更有可能成立(或不可能成立)。观察到足够的数据后,一个假设成立,或者几个假设同时成立。这样,贝叶斯定理就是一台将数据转化为知识的机器。

B4贝叶斯学习算法的优点是:

它也可以在数据较少的情况下进行推测。数据越多,推测的结果就越准确。它可以对获得的信息做出即时反应,并自动升级推测的学习功能。研究人员发现,当人们学习新概念时,他们通常可以从一个案例中学习,尤其是儿童。然而,机器学习需要成千上万的数据来达到相似的精度。人们也可以用更丰富的方式学习概念,比如在行动、想象和解释的层面。因此,科学家们提出了一个计算模型来捕捉人类的学习能力,并为基于字母的书写创造直观的概念。在这个模型背后,研究人员使用简单的贝叶斯程序来完成。在这个具有挑战性的分类任务中,贝叶斯程序克服了深度学习方法,达到了人的水平。该模型也通过了图灵测试。例如,识别垃圾邮件:为什么一个简单的数学概念如此神奇?研究人员提出了以下讨论:人脑的思维和决策过程像贝叶斯程序吗?我们知道达尔文用极其简单的模型解释了人类复杂的进化行为,那么贝叶斯定理会成为人脑的进化理论吗?大脑认知是贝叶斯程序吗?B5然而,没过多久贝叶斯网络之父“叛逃”。

朱迪亚珀尔从贝叶斯倡导者转变为“叛教者”。像量子力学的创始人之一爱因斯坦一样,他一生都不能接受量子力学的“不确定性”。那个时候折磨爱因斯坦的一个“幽灵”再次浮出水面,那就是因果关系。这是“人工智能”和“人类智能”之间不可避免的缺失元素。三十年后,人工智能变得越来越强大。朱迪亚珀尔对“因果”缺失的恐惧似乎未能阻止任何事情。然而,朱迪亚珀尔(Judea Pearl)对人工智能“黑匣子”的批评越来越强烈。他认为,即使是有显着成就的深度学习也只能使机器拥有优越的性能,但它并不智能,因为它缺乏现实的模型。一切都是统计拟合技巧。例如,朱迪亚珀尔说,机器本身并不理解拿着威士忌的行人对汽笛的不同反应。这种灵活性和适应性对人类智能来说是容易的,对人工智能来说是困难的。当人们用贝叶斯学习算法解决一个又一个难以置信的问题时,他们也会有疑问:除了概率的计算,我们能感知的逻辑在哪里?与此同时,人们也开始反思对人工智能的过度热情,并质疑普及人工智能的可能性。脸谱网人工智能副总裁埃罗姆佩森蒂(Erome Pesenti)认为人工智能很快就会“碰壁”。他认为有些人认为AGI是人类的智慧。但是人类智能本身并不是一个统一的问题。有些人认为AGI是一个可以自己进化的智能体,但是没有真正的模型。即使是人类也不能让自己变得更聪明。深度学习和当前的人工智能有许多局限性。我们离人类智能很远。它会传播人类偏见,而且不容易解释。它没有常识,更多的是基于模式匹配,而不是强烈的语义理解。然而,我们在解决其中一些问题方面取得了进展,这一领域的进展仍然相当快。你可以将深入学习应用于数学,也可以用它来理解蛋白质。你可以用它做很多事情。乐观的科学家正试图突破这一限制,并对AGI人类幸福指数的提高充满信心。人工智能的研究历史有一条自然清晰的脉络,从关注“推理”,到关注“知识”,再到关注“学习”。

现在,科学家们正试图找回“人肉推理”。参与创建“知识债务”的B6朱迪亚珀尔打算开始清算债务。

作为人工智能“黑匣子”的创始人之一,他试图引发一场因果革命。朱迪亚珀尔认为数据不理解因果关系,而人类理解因果关系。有一句话可以用来总结他的书《为什么》的内容,那就是:“你比你的数据更聪明”。因为没有比自我模拟更好的理解人类的方法了。创造阿尔法狗(AlphaGo)的哈萨比斯曾经说过,围棋人工智能战胜人类的秘密实际上是“模仿”人类的直觉。但在朱迪亚珀尔(Judea Pearl)看来,阿尔法狗缺乏解释是它的一个严重创伤。他说:因果关系不能归结为概率。人们经常使用“概率增加”的概念来定义因果关系:如果x增加了y的概率,那么我们就说x导致y。“这似乎没有什么错,但它会得出一个奇怪的结论,比如“淹死的人数由于冰淇淋销量的增加而增加”。有什么问题吗?x和y的共同原因,或混淆因素。冰淇淋不是溺水的杀手,但是因为夏天很热,冰淇淋的销售和游泳者的数量同时增加了。它看起来很简单,但它总是让我们困惑。朱迪亚珀尔给出了一个看似极其简单的工具:因果图。鹰在漫长的进化过程中发展了非凡的视力,但是为什么只有人类才能发明望远镜呢?朱迪亚珀尔称之为“超进化加速”。那么,人类是如何获得动物没有的计算能力的呢?答案是:因果想象。朱迪亚珀尔(Judea Pearl)在《人类简史》前面添加了一个关于人类祖先想象不存在事物的能力的“因果”。因果想象帮助智人祖先通过规划复杂的过程来完成许多事情,例如集体猎杀猛犸象。为了完成这一任务,思维主体需要构建一个模拟现实的心理模型。通过心理模型,猎人可以通过修改模块来提高成功的概率。基于此,朱迪亚珀尔建立了一个因果关系的阶梯。B7:如果你看到这个穿越山川河流的地方,你还记得“抓酒鬼”这个话题吗?

你一定已经发现了,这两个问题是“三门问题”的变体。概率和因果关系是什么关系?朱迪亚珀尔在她的书《为什么》中讨论了三个问题。作为一个解决问题的爱好者,我已经接触这个问题很久了。有趣的是,我“纠结”的“为什么”与《为什么》中的纠结非常相似。已知:在以下三扇门中,您选择了一个。具体规则和程序请参见下文。说这个问题太简单的人是不真诚的。那一年,在美国,这个问题困扰了许多专业人士和聪明人,包括大学教授、数学家和医生。疑问:1)一扇门打开后,还剩两扇门。每扇门后都有车的可能性不是一样的50%吗?2)如果主机打开一扇门,为什么该门最初的1/3概率分配给门C?a和c有什么区别?3)什么神秘的力量导致了概率的重新分配?即使你知道并理解了这个问题的答案,你可能仍然会错过这个话题的一个关键点:主人知道门后没有车吗?b. 《不确定世界的理性选择》对此有一个精确的描述:主人的规则至少有三种可能的解释。第一个规则是主人总是随机打开参与者没有选择的门(例如,在上面的场景中,主人扔硬币决定打开2号或3号门)。这意味着主人可能会打开一扇门,把车展示在门后,然后(和观众)开玩笑说你选错了门,游戏就结束了。第二条规则:假设主人总是选择藏着山羊的门打开,而从不打开参与者选择的门;当参与者已经选择了包含汽车的门时,主人随机打开了一扇门。这样,参与者的选择和主人开门之间的关系变得更加复杂。第三条规则:假设主人总是选择藏着山羊的门来开门,而从不打开参与者选择的门;在参与者已经选择了容纳汽车的门之后,主持人将选择其余两扇门中较小的一扇门来打开(这一规则可能还有其他偏差)。虽然这三个规则都符合上述表达式,但它们的潜在概率是不同的。在上面的话题中,我们注意到主人面前有一个属性:如果他知道车的下落。然后问题出现了。如果主人不知道哪扇门在车后面,那么他打开门b,发现后面没有车,你会换吗?答案是:不。因为汽车落后于空调的概率是1/2。贝叶斯定律可以非常简洁地用来解决三个难题,证明主持人是否知道真相会使结果不同。感兴趣的学生可以学习下面的图(请把盒子换成门。原始图中的一些表达式不是很准确,但是公式和结果是正确的):(下面是一个带有轻微打字错误的截图。(贝叶斯公式可以帮助我们正确解决这个问题,但它能帮助我们真正理解这个问题吗?不完全是。即使贝叶斯定理帮助我们正确计算结果,它也违背了人脑的直觉。否则,就不会有这么多教授和医生被“三个问题”羞辱。朱迪亚珀尔想用“因果图”来寻找“三个问题”的解释。让我们看看因果图是如何工作的。

如我之前所说,“三门问题”可以分为两种情况:一是主人知道车在哪个门后面,故意选择不带车的门;主人不知道汽车在哪个门后面。首先,让我们谈谈情况a。画一个因果图如下:主机打开哪扇门?这件事受到“你选择的门”和“车的位置”这两个“原因”的影响。按照因果图,你可以很容易地发现,根据主人打开的门,你可以顺着右边的箭头找到无意中透露给你的“汽车位置”的信息。因此,如果你选择换门,概率会增加。此外,案例b .绘制因果图如下:因为在这种情况下,主机不知道汽车在哪里,所以右边的因果箭头消失了。

因此,您最初选择的门的获胜概率与另一扇关闭的门相同,您不需要更改它。因果图似乎只画箭头,但事实上,概率仍然隐藏在箭头后面。为什么这么简单的结构这么容易使用?因为它带有因果信息。为什么这么一个“简单”的问题让这么多聪明人困惑?原因如下:1 .我们的大脑(和直觉)不擅长处理概率,但擅长处理因果关系;2.正如我们的大脑会被“冰淇淋销售导致溺水人数增加”这样的伪因果关系弄糊涂一样,我们也会怀疑隐藏的概率相关性。两个聪明的家伙,阿莫斯特维斯基和丹尼尔卡内曼,发现了概率和心理学的交叉,并开创了行为科学和行为经济学。我喜欢这两个人,还有赛雷。在他们的研究中,你可以看到各种有趣的基于概率的实验。人类的认知偏见不仅荒谬,而且高度一致。我们的大脑不是为概率而设计的,但是概率是世界如何运作的秘密。当我们依靠祖先的直觉而不是概率来做决定时,做蠢事是非常容易的。即使我们知道概率,我们也会尽最大努力按照概率程序进行思考和决策,这仍然会受到“框架效应”的限制。我的分析是:当面临一个概率问题时,很多人都能回答;当两个简单的概率问题加在一起时,绝大多数人都无法通过心理计算来做任何事情。这就是为什么像“三门问题”这样极其简单的问题会让这么多聪明人困惑。明智的决策和风险管理通常需要“反人类”的知识和情感。对于这个伟大的研究方向,我必须从结构完整性的角度来提及它。但是必须尽快完成。为了避免邪恶和促进善,我们必须判断我们应该做什么。我们不仅要考虑善与恶本身,还要考虑它们发生或不发生的概率,直观地考虑它们在整体中的比例。这些考虑可能看起来微不足道,但如果仅此而已,那就是了。然而,我们可以让他们发挥重要作用,其中最重要的是让我们更理性地面对希望和恐惧。(摘自佩尔西戴康尼斯:“十个最小概率类”)B9相关性对因果关系的干扰不能仅靠观察来解决。

因此,《波尔罗亚尔逻辑》提出“观察、干预和反事实三个步骤构成因果关系的阶梯”。因果关系阶梯的每一级都有一个代表性的有机体。大多数动物和当前的学习机处于第一层次,它们通过联想学习。像早期人类这样的工具使用者处于第二层次,只要他们有计划地行动,而不仅仅是模仿。我们也可以通过实验了解干预的效果,这可能是婴儿获取大多数因果知识的方式。反事实学习者在梯子的顶端。他们可以想象一个不存在的世界,并推测观察到的现象的原因。(资料来源:玛雅哈尔图)朱迪亚珀尔(Judea Pearl)解释道:贝叶斯网络适用于一个所有问题都归结为概率或(在本章术语中)变量之间相关程度的世界。它不能自动升级到因果关系阶梯的第二或第三层。幸运的是,我们只需要修改两次就可以升级它。朱迪亚珀尔(Judea Pearl)不想陷入对因果的无知,而是试图跳出统计的黑箱,通过因果的阶梯澄清事物的本质。他试图表达:概率可以编码我们对静态世界的信念,而因果关系告诉我们当世界改变时,概率是否会改变,以及如何改变,无论是通过干预还是想象。当然,贝叶斯网络仍然是人工智能领域中非常重要的工具,因为它涵盖了因果图的大部分数学基础。B0人再次站在“因果关系”的十字路口。

回顾过去,因果关系和黑盒经历了四次值得注意的冲突。第一个是巴比伦和古希腊之间的科学竞赛。哲学家斯蒂芬图尔敏(Stephen Toulmin)认为:他的解释非常有趣:巴比伦天文学家是黑盒预测的大师,在准确性和一致性上远远超过古希腊人。然而,科学更青睐希腊天文学家的创造性思维策略。古希腊的厄拉多塞测量了地球的半径。这在巴比伦永远不会发生。牛顿第二次给人类带来了光明。

凯恩斯发现牛顿不是理性时代的第一人,而是研究牛顿手稿的最后一位魔术师。牛顿被玫瑰十字、占星术和数字学迷住了。他相信摩西早就认可哥白尼的日心说和他自己的引力理论。一方面,牛顿认为上帝是造物主;另一方面,牛顿认为没有必要干涉人类事务。因此,牛顿“发现”了上帝“用来”创造这个世界的合理性和普遍原则。写作:令人惊讶的是,最近的学术发现指出,如果牛顿没有进行炼金术的研究,“他可能不会做出那些改变世界的发现”。他基于自然规律和理性认知的世界观为人类提供了因果解释框架,改变了整个世界。牛顿的世界里没有概率。当骰子被抛出时,理论上我们可以计算一切,只要我们知道初始值。“法国牛顿”拉普拉斯把这种决定论延伸到整个宇宙,“我们可以把宇宙的当前状态看作它过去的果实和它未来的事业。”一个超级聪明的人,即拉普拉斯恶魔,如果他知道所有的原因,就可以预测任何事情。在牛顿的追随者看来,概率是人类无知的产物。在我们这个时代,绝大多数人的思想仍然停留在牛顿时代,但是他们在物理和数学上没有牛顿的理性,然后他们口头上谈论量子力学。不管他们如何对待量子力学,他们骨子里都相信“决定论”。但这是虚无决定论。第三是爱因斯坦和玻尔之间的争论。尽管量子理论是在他自己的理论基础上发展起来的,爱因斯坦拒绝接受一个过于随机的解释:概率被用来解释电子的位置。爱因斯坦不同意量子力学的统计性质,他说:“我仍然相信我们可以给出一个真实的模型来直接描述事件本身,而不是事件发生的概率。”他讨厌没有因果关系的“量子纠缠”的超自然力量。玻尔反驳道:“没有量子世界,只有抽象的量子力学描述。我们不应该认为物理的工作是发现自然。物理学只涉及我们如何描述自然。”就哲学而言,我更喜欢玻尔。物理科学在描述自然秩序中的地位必须受到限制。第四次是当前人工智能的“黑箱纠纷”。以前,大多数人工智能的实践者仍然通过逻辑来处理人工智能技术。例如,深蓝队仍然需要专业球员。现在呢?得益于计算能力的巨大增长,人们让神经网络通过使用巨大的向量来表达内部含义而不是逻辑推理来自行学习。一切都变了。

与传统的机器学习不同,深度学习是基于人工智能,直接从事物的原始特征出发,自动学习产生高级认知结果。在输入数据和输出答案之间,有一个“隐藏层”,即所谓的“黑盒”。这个黑匣子既无法观察也无法理解。

即使人工智能能解释,我们也不明白。哥伦比亚大学机器人专家霍德利普森称之为:“这就像向一只狗解释莎士比亚是谁。”中国科学院院士、致远研究所学术委员会主席张博将人工智能分为以下三次:第一代人工智能,一种基于知识和经验的推理模型,以失败告终;第二代人工智能利用了基于大数据的深度学习,取得了意想不到的成果,但算法无法解释(因果缺失);第三代人工智能是在当前第二代人工智能的基础上发展起来的,它增加了人类的常识和知识,建立了一个可解释的、健壮的人工智能理论,发展出可信的、安全的、可靠的人工智能

哈萨比斯的抱负是发明通用人工智能。如果实现了,因果和黑盒的争论会消失吗?他认为深入学习是通用人工智能解决方案的一个组成部分,可能需要更多类似于深入学习的突破。需要更多的创新。哈萨比斯对人工智能有超人的洞察力和极其乐观的态度。他拥有计算机科学学士学位和认知神经科学博士学位。他用人脑作为类比:大脑是一个综合系统,但是大脑的不同部分负责不同的任务。哈萨比斯领导的团队正在研究的项目是:我们能从自己的感知中构建,利用深入的学习系统,并从基本原则中学习吗?我们能把它一直建设到高级思维和象征性思维吗?人工智能要模仿人类智能还有很长的路要走。本文第一部分,错觉和概率计算;本文的第二部分是因果关系和人工智能。本文的第三部分是概率权重与物理世界的关系。C1:让我们看看这篇文章的最后一个主题:谁是幸运的罪犯?三名死刑犯被关押在监狱的单人房间里。法官赦免了其中一人,警卫知道是谁,但不能说。囚犯甲对卫兵说:“我知道你忠于职守,所以我不会问你赦免的人是谁而让你难堪,但是请告诉我,谁将被处决,乙还是丙?”警卫想了一会儿,发现这是合理的,因为乙和丙中至少有一个还会被处决,那么告诉甲有什么关系呢?

于是卫兵说:乙将被处死。囚犯甲非常高兴,因为被赦免的一个配额(可能性)由三个人分享,他自己的概率是三分之一。现在呢?由于证实了乙肯定会被处死,他存活的概率从1/3增加到1/2。甲把这件事告诉了犯人丙就更开心了。他认为他被赦免的概率已经从1/3变成了2/3,而A幸存的概率不是1/2,而是1/3。关于a和c谁是对的?答案是:是的。那么,甲的逻辑到底有什么错?C2:你肯定会发现这仍然是一个“三门问题”。

工作方式相同。但是我不会再厌倦这个话题了。你有没有觉得即使我在这篇文章中煞费苦心地想出三个几乎相同的问题:三个男人,酒鬼和罪犯,即使你知道每个问题的答案,你也必须承认你总是觉得奇怪。让我们回到三个问题。虽然我已经介绍了平行宇宙法、贝叶斯定理法和因果图,但我们大脑的直觉仍然深感困惑:主人是否知道乙门后没有车,他做同样的动作(打开乙门)并得到同样的结果(乙门后没有车),为什么会有完全不同的答案?另一个例子是:如果主人知道哪扇门后面有一辆车,但是当他开门时,如果他假装他真的不知道并且只是随机开门会发生什么?意识能独自驱动世界吗?这不是反科学吗?我是物理爱好者。在接受结果之前,我必须从“力”的角度找到一个“真正的”原因。我的想法是:如果主人知道车在哪里,比较不知道,即使他做了同样的动作,他也会引入额外的信息。这是在大脑中做功的过程。工作是能量从一种形式转换成另一种形式的过程。做功的两个基本因素:作用在物体上的力和物体在力的方向上经过的距离。经典力学的定义是:当一个力作用在一个物体上,并使该物体在力的方向上通过一段距离时,力在力学上被称为对该物体做功。那么,你的大脑是如何工作的呢?再分配概率。如果主人知道门后是否有车,并且选择没有车的门,那么他正在工作。C3:我不相信任何鬼魂的力量。

虽然我喜欢神秘的经历,但我不喜欢神秘的解释。即使我们是真实的或想象的,我们也会遇到各种各样的怪物。例如,麦克斯韦妖。(以下来自维基百科。麦克斯韦恶魔(Maxwell's demon)是物理学中想象出来的恶魔,可以探测和控制单个分子的运动,这是英国物理学家詹姆斯麦克斯韦在1871年为了说明违反热力学第二定律的可能性而构想出来的。如图所示,隔热容器分为两个相等的隔间,中间有一个绿色“恶魔”控制的小“门”。当进行不规则的热运动时,容器中的空气分子会撞击门。“门”可以选择性地将更快的分子放在一个隔间中,而将更慢的分子放在另一个隔间中。这样,一个隔间将高于另一个隔间。这个温差可以用来驱动热机做功。这是第二种永动机的一个例子。换句话说,如果我们忽视开门和关门的工作,这个绿色小怪物“成功”建造了一台永动机。我们知道这是不可能的。有什么问题吗?张田蓉在博客中描述了人类揭开“麦克斯韦妖”面纱的过程。这个怪物是神人麦克斯韦的思想实验。另一个名叫希拉克德的神人也在1929年做了一个出色的思想实验。希拉克德的单分子发动机如上所示。根据麦克斯韦的模型,希拉克德构建了一个简化的地精系统,只管理“一个”分子。麦克斯韦妖控制单分子热机。地精通过测量知道分子的位置是在左边还是右边:如果结果是左边,隔板放置在分子的右边,重物通过绳子连接到系统的左边。单分子气体经历等温过程,通过从环境中吸收热量而膨胀,并举起重物做功;如果结果是正确的,将重物挂在系统的右侧以获得工作。希拉克德有没有可能更生动地创造了一个违反第二定律的永动机?说到这里,你可能会理解为什么我想在一篇关于概率的文章中谈论热力学的意识形态实验。希拉克德想思考的是:如果我们允许一个智能生物干涉热力学系统,在什么情况下可以建立一个第二类永动机?回想一下“三门问题”。当主人打开第二扇门时,如果他知道这件事并故意用汽车避开门,他实际上是“介入”的聪明生物。

回到希拉克德的思想实验。他的解释是问题在于“测量”。地精测量的目的是获取信息,即在每次将系统恢复到原始状态的过程中,至少需要获取一位二进制信息。获取信息需要一个价格,也就是说,增加周围环境的熵。因此,系统“热熵”的降低是由于地精测量过程中“信息熵”的增加。系统的总熵因此增加,热力学第二定律仍然成立。

尽管古怪的香农(Shannon)用了近20年时间才提出信息论,但希拉克德第一次意识到信息的物理本质,并将信息与能量消耗联系起来:信息就是熵。1961年,物理学家罗夫兰道尔(Rove Landauer)提出并证明了兰道尔的原理:计算机在删除信息的过程中向环境释放的热量非常少。1981年,贝内特(Bennett)的论文表明,麦克斯韦恶魔控制“门”使分子从一个网格进入另一个网格的耗散过程并没有发生在测量过程中,而是发生在恶魔判断前一个分子的“记忆”的去除过程中,这个过程在逻辑上是不可逆的。2012年,德国奥格斯堡大学的埃里克鲁兹(Eric Lutz)和他的同事们通过实验验证了朗道的信息擦除原理。根据实验结果,他们获得了消除信息需要多少能量,这证明了朗道的理论确实是正确的。

那么,信息是一个物理实体吗?C4,让我们回到三个问题。

现在我的兴趣不是概率计算,而是概率如何干扰真实的物理世界。当主持人知道并故意选择时,他实际上“指定”了b门。当可怜的观众面对未知的世界并做出不确定的选择时,主持人实际上是一个无所不知的聪明生物。他干预了“不确定性”的分布。主持人通过工作来重新分配概率。不管主人是否知道乙后面是否有车,他实际上已经介绍了新的信息(乙门后面没有车)。当他知道的时候,他正在积极干预。当他不知道时,这是被动的刷新。这两种情况的结果是不同的。这意味着获取信息的方式和信息本身一样重要。让我们绕过“先验概率”和“贝叶斯定律”的知识和公式,用人脑直觉可以理解的因果逻辑来思考:如果主人不知道b门后面是否有车,他随机打开b门,发现它是一只羊,但关闭b门后面一系列平行的汽车世界,这部分可能性被分配给a和c;

如果主人知道乙门后面没有车,那么乙门和丙门后面有车的平行世界,每辆车有1/3,总共有2/3的车的可能性,完全在他的控制之下。他自愿选择关闭平行世界,将车停在乙门后,并将概率给了丙门。如果你愿意画一张平行宇宙地图,你会更直观地理解这一点。知道这些卡片的主人是“麦克斯韦妖”。C5虽然我个人喜欢用“平行宇宙”的视觉方法来解释不太明显的概率问题,但这并不意味着我喜欢这个概念。平行宇宙(多元宇宙)理论指出,除了我们的宇宙之外,可能还有其他宇宙,这些宇宙是对宇宙可能状态的反应。这些宇宙可能与我们所知的宇宙有相同或不同的基本物理常数。平行宇宙经常被用来说明一个事件的不同过程或不同决策的后续发展存在于不同的平行宇宙中。例如,一个随机的骰子被抛出并在空中高速旋转(无论是牛顿力学的照相机还是拉普拉斯恶魔都无法计算)。哪个数字会落在上面?从概率的角度来看,每个数字都有相同的机会去面对。在这种情况下,使用平行宇宙方法,我们可以想象在某个时刻,未来将分裂成六个平行宇宙。关于哪个数字上升的最终猜测实际上是为了确认观察者降落在哪个平行宇宙中。从观测中获得的信息被用来关闭那些不一致的平行宇宙(或降低概率),并确认那些一致的宇宙(或增加概率)。弦理论物理学家布赖恩格林在他的书《为什么》中说:时间不是我们通常所说的从过去流向未来的河流。时间流实际上更像一个巨大的冰块,每时每刻都在冻结所有宇宙事件。人类的意识,或者说记忆,就像电影院放映机的光线,不断地照射在冰上。被照亮的框架变成了现实,其余的冰没有被照亮,也就是说,过去或未来。这篇文章很有诗意,但它似乎混淆了人类的困境:困扰我们的是现实是什么?什么是投射在现实上的人类谬误?溴化六烃季胺

埃隆,谁用物质世界的发明和创造征服了硅谷?马斯克直接跳过了“理想主义”和“现实主义”之间的对立,他声称我们生活在现实世界中的可能性只有十亿分之一。艾伦。马斯克说,宇宙的绝对年龄是138亿年,这意味着外星文明有足够的时间发展一个复杂的系统。“假设以任何速度发展,游戏将与现实一样,否则一个文明将会终结,并且两者都将不可避免地发生。因此,我们很可能生活在虚拟世界中。”“我认为很可能有许多虚拟世界。这只是一个概率问题。你也可以称它们为现实或多元宇宙。”麻省理工学院游戏实验室负责人、计算机科学家里兹万维克(Rizwan Virk)也是“模拟理论”的信徒。维克说,我们周围的一切,包括地球和宇宙,都是非常复杂的MMORPG(大型多人在线角色扮演游戏)的一部分,我们都是这个游戏的玩家。一种可能性是,我们都是运行在别人电脑上的模拟系统中的人工智能。另一种可能性是,我们在游戏中是“玩家角色”,有意识地存在于模拟世界之外,就像在RPG游戏中扮演精灵或矮人一样。人类世界可能是一个由全能的神创造的沉浸式游戏。游戏提供了神没有和渴望的不可知、不可逆和随机的东西。因为所有全能的神在控制之日都是徒劳和绝望的。所以,我想问:这个游戏的秘密是什么?

我们只是想赢吗?还是超级物种只是试图体验低等物种的无助和随意性?如果我们的世界真的只是一场游戏,那就太真实了。就像埃隆一样?马斯克说,“如果生活是一个电子游戏,那么画面很棒,但是情节混乱,教程太长了。”事实上,我们不需要想象虚拟世界已经覆盖了现实世界。最直观的指标之一是钱。商业世界的权力正在迅速转移到虚拟世界。只生产“数字”的公司开始主宰世界。物理世界和人类行为变得越来越数字化。人与人之间的关系以及人与事物之间的关系被投射到一个虚幻的世界中。我称之为数字殖民地的建立。人类历史上最富有的公司,以前是物理殖民地公司,现在是数字殖民地公司。凯文。凯利预测了未来科学技术的发展趋势。关键词是:镜像世界。他认为镜子世界将是未来20年的一个重大变化。这种变化将叠加数字世界(如物联网、3D模型、SLAM等)。)存在于现实的物质世界中。就像人与人之间的联系(社交媒体)和世界上所有信息的联系(互联网)一样,镜像世界将物理世界与虚拟数字信息联系在一起,创造了人与计算机之间无缝的交互体验。在未来的世界里,现实世界中的一切都将有一个芯片,整个世界将被数字化,虚拟数字世界中的一切都将有一个复制品,就像现实世界的一面镜子。这是什么意思?虚拟世界的商业统治者将比现实世界的商业统治者更能在成员之间分配概率权力。我的观点的推理逻辑如下:1 .在镜像世界中,一个商业统治者可以通过驱动你的“数字投影”来驱动你的物质世界和银行账户中的一切;2.在数字世界中,商业统治者只有通过分配概率权才能获得被统治者的服从、喜悦和奉献。3.硅谷模式和精益创业都是数字时代的产物。数字商业世界中的流量交易、知识产权价值、互联网红色经济和定量交易都是“分配概率权”的商业游戏。当主人像一个魔法大师时,重新分配大门后汽车获胜的概率象征着麦克斯韦在虚拟(数字)世界中的恶魔。只有一点点信息,它比万能的拉普拉斯恶魔更容易改变一个人的命运。C8我很好奇,如果我只是一个游戏玩家,完全不知道自己沉浸在“我”的角色中,如果我醒来,我会在哪里?当我醒来时,我想说的第一件事是:谁设计了这样一个可怕的游戏?当然,我无法想象如果游戏消除了愚蠢、贪婪和残忍会发生什么。不管这个世界是真实的还是不真实的,不管我是虚拟角色还是沉浸在角色中的玩家,至少在此刻,我是存在的。“被感知的东西不存在;存在的只是感知它的头脑。”这样,世界是否真实并不重要。休谟认为,“本体”是否存在并不重要。重要的是:对于因果关系,休谟主张:“我们没有办法知道因果关系之间的关系,只知道某些事情总是联系在一起的,这些事情在过去的经验中从来没有分开过。我们看不透连接这些东西背后的原因。我们只能观察事物本身,发现这些事物总是通过一种有规律的联系在我们的想象中被分类。”休谟放弃了因果关系“必然性”的信念,奇迹般地逃脱了哲学家自由意志的困境:“如果所有事件都是由“明确的因果关系”决定的,我们的自由意志在哪里?就像拉普拉斯恶魔真的存在一样,它可以知道组成你我的每个分子、原子和电子,也可以知道每个人不可避免的命运。幸运的是,情况并非如此。书《思想史》说:因此,人类行为没有“必要性”。但是人类仍然是自由的,因为他们是他们行动的原因。这意味着尽管我们的命运就像掷骰子一样,但我们仍然有掷骰子的可能性。这真是一个奇妙的设计。C9没有证据表明贝叶斯提出贝叶斯公式来反驳休谟。

但是很可能休谟启发了贝叶斯。休谟在1748年出版的《《宇宙的结构:空间、时间以及真实性的意义》》中写道:虽然世界上没有概率这种东西,但我们的无知对理解有着同样的影响,并产生了类似的信念或观点,因为我们不知道任何事件的真正原因。当我们做出所有推论时,我们将在习惯的控制下把过去的经验应用到未来。虽然我们倾向于最常见的结果,并相信这样的结果一定会发生,但我们不应该忽视其他结果。当然,我们必须根据每个结果出现的频率或多或少地给予它们权重和可靠性。贝叶斯在他神秘的文章中找到了一种判断概率的方法:假设对于某个事件,我们只知道它发生的次数和在特定情况下失败的次数。借助他设计的方法,我们可以在同样的条件下判断事件发生的概率。也没有证据表明贝叶斯公式是为了证明上帝的存在。然而,这个公式出奇的简单和强大,但它似乎是上帝的杰作。C0现实世界中许多关于贝叶斯公式创造奇迹的传说看起来像奇迹般的迹象。例如,图灵在第二次世界大战期间使用贝叶斯理论破解德国代码。在所有这些故事中,我喜欢下面关于搜救队的传说。2013年7月的一个晚上,一艘捕虾船的船员失踪了。海岸警卫队发现自己面临着一项不可能的任务:没有确切的失踪时间和地点;我们需要在4000平方公里的海里找到一个人。这就像大海捞针。警卫采用了一种叫做“搜索救援优化规划系统”的神奇工具,这实际上是一种基于模糊线索和当地条件大大缩小搜索救援范围的算法。有不止一个类似的案例。起初,这似乎不可靠。然而,该算法根据搜索结果不断更新路线。希望有时是在没有希望的地方孕育出来的,因为“没有希望”消除了“希望似乎是附属的”的幻觉。在这个故事中,七个小时后,救援人员一无所获,决定返回基地加油。然后副驾驶突然喊道。他们转过身,发现失踪的机组人员被困在汹涌的大海中,绝望地向飞机挥手。一个简单的贝叶斯公式,只需要很少的信息,就能在浩瀚的海洋中拯救一个人这是命运、信念和算法的隐喻:我们的大部分生活就像在一个没有多少已知条件的无尽海洋中。但是大多数时候,我们有限的努力和笨拙的推理可以让我们脱离危险。生活通过说不(对你认为的“真相”)来帮助你一步步接近真相。信仰上帝的贝叶斯神父创造的公式似乎告诉我们,你的自由意志存在于这个世界的每一次探索和斗争中,存在于你永不放弃的权利中。最后,如果我哭了,谁会在天使的序列中听到我?即使其中一个人突然把我抱在胸前,我也会从他更强大的存在中消失。因为美不是“而是我们只能忍受的恐怖的开始”。

我们如此赞美它是因为它和平地

蔑视摧毁我们。每个天使都很可怕。

所以我克制住自己,咽下了深深的黑暗

哭泣。啊,我们需要的时候可以找谁?不是天使,不是人;

甚至那些知道它的野兽也意识到在这个被解释的世界里“我们”感觉不太安全。我特别喜欢《经验主义》的开头段落,它充满了张力。

贝叶斯公式也有一些令人费解的张力。例如,信念和计算,模糊和精确,过去和未来,现实和幻觉。类似于飞轮转动的先验概率和后验概率,我们似乎(并且只能)在比较和变化中感知和理解世界。借助于条件和时差的变化,我们在温差中感受温暖和寒冷,在爱与恨中感受情感,在得失中感受占有,在起伏中感受意义。从理性的角度来看,贝叶斯告诉我们,即使最初弱小,你仍然可以通过永不放弃的小小努力一步步接近真理。从感性的角度来看,贝叶斯帮助我们避免陷入“一切都是注定的”的虚无之中,并允许每个人以自己的方式平等地“存在”。如果有创造者,他为什么要这样设计它?有人说上帝是一个程序员。他通过调整参数来调整每个人的命运。如果是这样的话,他肯定不会自己控制每个人的参数,而只会设计一个算法,把旋钮给每个人自己。在这个算法中,可能有这样一个参数:概率权重。我对已知和未知的尺度、人类与地球、地球与宇宙之间的尺度比感到好奇,甚至对此刻生命、生命和永恒之间的尺度比更加好奇。一天早上,当我看到阳光从百叶窗斜射进书房时,我不禁写道:“这个世界只给了我一个小角落。在很短的时间内,我遇到了几个人,经历了非常简单的事情。

扫描并回复“信息技术老板”,进入信息技术老板的专业社区



湘桥农业网 版权所有© www.clanigu.com 技术支持:湘桥农业网 | 网站地图