程序员的数学--用贝叶斯定理来推断一个案子 文旅部新规:在线旅游网站不得擅自屏蔽删除评价 不得大数据杀熟 苏宁易购开学季消费大数据:手机以旧换新销量增长299% 做实供电服务“133” 助大数据直上“云”端 思科前程序员离职 5 月后“删虚拟机跑路”,240 万美元打水漂,网友:够狠! 抗疫代码成国博最新藏品 阿里程序员“写代码写进国博挺酷” 国博史上首次收藏代码!它们是阿里程序员写下的抗疫代码 威胜信息发布2020年上半年业绩:物联网产业进入爆发期 营收净利双增长 下月发布会不止有新品折叠屏手机 酷开的物联网家居生态野心初现 史上最全的数据库面试题 数据库面试必看 一个数据库SQL查询的数次轮回 百度智能云正式对外发布百度智能云数据库品牌GaiaDB 数据库三大泛式是什么 电力行业网管需求 IT运维管理解决方案 citrix桌面虚拟化中的运维工具Director SRE运维体系的构建和工作职责划分 运维的核心价值是什么 手游开发定制的全过程详解 开发人员透露:《赛博朋克2077》枪支泛滥 成熟的产品经理如何应对“这个需求不合理” CI/CD管道对开发和运维的重要性 APP开发的流程是怎样的 如何开发一个APP 零基础学web前端开发要学多久 如何系统学习 Web前端要学习哪些内容呢 前端工程师至少要满足四类客户的需求 前端学习计划思维导图 前端人如何选择自己的技术栈 前端人如何更快地成长 大数据的七大核心具体价值 核心价值究其用户到底是谁 大数据核心技术是什么 该怎么掌握Hadoop知识 未来大数据应用场景广阔 中国将成为全球最大的数据圈 2020大数据产业生态大会通过“现场论道+云端连线”全程直播的方式在北京举行 2020中国大数据生态产业大会 华为云大数据连续四年荣登50强榜首 中国电信全面提速大数据新基建 无法启动计算机时该怎么办 通过这6个专业技巧来加速计算机 计算机专家提供在家工作或学习的技巧 2020年空中数据计算机市场新战略报告:技术进步,趋势与增长 物联网分析市场前景2020-2025年最新发展数据和市场趋势预测 马来西亚主要供应商的物联网(IoT)安全市场规模和增长 2020年医疗保健行业的物联网(IoT)市场分析以及到2025年的未来需求 零售市场类型和应用中的物联网(IoT)展望和2025年预测 蒙特利尔华纳兄弟公司正在寻找新程序员 而工作就是玩家的天堂 世界各地的5位著名女程序员 代码中的AI:AI对开发人员做了什么 如何找到程序员的第一份工作 盲人程序员创建没有图形的手机游戏 花费不到30美元 即可成为拥有30小时教程的专家Python程序员
您的位置:首页 >程序人生 >

程序员的数学--用贝叶斯定理来推断一个案子

贝叶斯讲什么呢?

先抛出一个问题:

我有一个同事年不群,请问他是正人君子的可能性有多大?

因为可能性是个主观感受,没有办法量化,所以在数学中一般会问年不群是正人君子的概率有多高?

初看无从下手,但其实也有套路可循。

先给一个假设然后观察验证和修改得到相对靠谱的结果

比如,我们具体可以先这样做:

假设他是正人君子的概率是 0.5寻求证据,证明他是正人君子或者否修正之前的假设概率得到最终概率

你看看,这实际和我们的日常生活也差不多,贝叶斯定理正好可以解决如此问题,不过它是数学工具。

什么是贝叶斯定理?

因为是数学工具,它有自己的公式:
P(HE)=P(H)P(EH)/P(E)P(H|E)=P(H)*P(E|H)/P(E)P(H∣E)=P(H)∗P(E∣H)/P(E)

我归纳如下:

贝叶斯定理是一个通过修正先验概率最终求得后验概率的过程。

先验概率

上面公式中的 P(H) 是先验概率。

先验概率一般指事先统计、经验估算的概率,它是一个既成的事实,不以人的意志为转移。

条件概率

P(E|H) 是条件概率,当事件 H 发生时,事件 E 也发生的概率是多少

标准似然度 1

P(EH)/P(E)P(E|H)/P(E)P(E∣H)/P(E)

后验概率

P(H|E) 是条件概率,但因为标准似然度的原因,它被称为后验概率。
P()=P)P(后验)=标准似然度*P(先验)P(后验)=标准似然度∗P(先验)

贝叶斯推理尝试

好了,公式知道了,我们来求年不群是不是正人君子的概率。

1. 给假设概率

假定一个人是正人君子的概率是 0.6,我们用 P(H) 表示,H 是假设(Hyposesis) 的缩写
P(H)=0.6P(H) = 0.6P(H)=0.6
比如 100 个人当中有 60 个正人君子,40 个猥琐男。

2. 观察论证

我一直以为你是正人君子,直到。。。

这个句式是比较常见的电视剧台词模板,说明了什么呢?

一些新的线索,让之前的看法发生了改变。

比如:

我一直以为你是正人君子,直到发现你最终经常做一些猥琐的动作。我一直以为你是正人君子,直到发现你每天读《曾国潘家书》。

两种不同的证据,会改变假设的可能性,可能增强,可能减弱。

设想,我们发现的第一类证据,看见了年不群做一些猥琐的动作。

猥琐男不一定做猥琐的动作,做猥琐动作的也可能是正人君子。

怎么把这个现象用数学概率描述出来呢?

猥琐动作记为事件 E,它其实也有概率,用 P(E) 指代,E 是 Evidence 的缩写。
P(E)=P(EH)P(H)+P(EA)PAP(E) = P(E|H)*P(H) + P(E|A)*P(A)P(E)=P(E∣H)∗P(H)+P(E∣A)∗P(A)
这里的 A 代表猥琐男,P(A) 是猥琐男的概率。

P(E) 的意义是一个人做猥琐动作的概率,包括了正人君子做猥琐动作的概率和猥琐男做猥琐动作的概率。

假设 60 个正人君子中有 5 个人做了猥琐的动作,那么按照统计学的算法
P(EH)=5/60=0.083P(E|H)=5/60=0.083P(E∣H)=5/60=0.083
假设 40 个猥琐男中有 36 个人会做猥琐的动作,那么概率是:
P(EA)=36/40=0.9P(E|A)=36/40=0.9P(E∣A)=36/40=0.9
那么,整体人群做猥琐动作的比例就可以根据公式求出来了:
P(E)=P(EH)P(H)+P(EA)PA=0.0830.6+0.90.4=0.05+0.36=0.41P(E) = P(E|H)*P(H) + P(E|A)*P(A)=0.083*0.6+0.9*0.4=0.05+0.36=0.41P(E)=P(E∣H)∗P(H)+P(E∣A)∗P(A)=0.083∗0.6+0.9∗0.4=0.05+0.36=0.41
这样,套公式后验概率也可以求出来了:
P(HE)=P(H)P(EH)/P(E)=0.60.083/0.41=0.12P(H|E)=P(H)*P(E|H)/P(E)=0.6*0.083/0.41=0.12P(H∣E)=P(H)∗P(E∣H)/P(E)=0.6∗0.083/0.41=0.12
这代表什么呢?

代表年不群是正人君子的概率是 12%.

但如果不考虑证据的前提下,他的先验概率可是高达 60%。

数学题目练习

一个幼儿园的男孩、女孩的比例是 4.5 :5.5,男孩子往水池扔东西的概率是 0.6,女孩子扔东西的概率是 0.4。现在发现水池有一个玩具,请问是男孩子扔的概率是多少?

A 代表男孩子,所以 P(A) 为 0.45

B 代表女孩子,所以P(B) 为 0.55

E 代表扔东西,P(E|A) = 0.6,P(E|B)=0.4,所以:
P(E)=P(EA)P(A)+P(EB)P(B)=0.60.45+0.40.55=0.49P(E)=P(E|A)*P(A)+P(E|B)*P(B)=0.6*0.45+0.4*0.55= 0.49P(E)=P(E∣A)∗P(A)+P(E∣B)∗P(B)=0.6∗0.45+0.4∗0.55=0.49
那么套用贝叶斯公式
P(AE)=P(A)P(EA)/P(E)=0.450.6/0.49=0.55P(A|E)=P(A)*P(E|A)/P(E)=0.45*0.6/0.49=0.55P(A∣E)=P(A)∗P(E∣A)/P(E)=0.45∗0.6/0.49=0.55
男孩子的概率也只是 55%,看起来,男孩子淘气,但是女孩子数量多且扔东西的比例也不低,所以,不能随便冤枉人。

贝叶斯定理的影响因子

回到贝叶斯定理的公式:
P(HE)=P(H)P(EH)/P(E)P(H|E)=P(H)*P(E|H)/P(E)P(H∣E)=P(H)∗P(E∣H)/P(E)

P(E)=P(EH)P(H)+P(EA)PAP(E) = P(E|H)*P(H) + P(E|A)*P(A)P(E)=P(E∣H)∗P(H)+P(E∣A)∗P(A)

能够影响最终结果的有 4 项:

P(H)P(A)P(E|H)P(E|A)

先验的重要性

先验如果不是经过严密的统计数据那么就和拍脑袋一样,或者说本身就是拍脑袋,如果证据很少或者是难以发现,最终的结果就很难保证公平。

比如,发生案子的时候,你锁定了一个嫌疑犯,如果没有找到关键证据,你能轻易给定论吗?

证据的重要性

证据和假设正相关,代表标准似然度 > 1,它能够增强假设。

证据和假设负相关,代表标准似然度 < 1,它会减弱假设。

证据和假设毫无关系,代表标准似然度 = 1,它对结果毫无意义。

所以,证据也同样需要严谨对待。

贝叶斯定理的意义

贝叶斯定理应用很广,任何需要预测估计的地方,几乎都可以应用。就我实际接触过的有机器学习和自动驾驶。

贝叶斯也有很现实的生活哲学意义。

大数据时代,你在网络上看到的故事可能不是事实,可能它是假的。一个事实也可能不是数据,因为它可能是孤立的不具代表性,数据可能不是证据,它可能是片面的,只是别人刻意让你看见的。2

你很可能被你的直觉或者表面现象欺骗。

参考


frank909CSDN认证博客专家CV(computer vision)爱阅读的程序员,专注于技术思考和分享。关注架构设计、Android 开发、AI、数学、自动驾驶领域,个人公号:Frankcall

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。