1、概率方法建模,数学与信息科学系任煜东qq:466432705,前言:什么是数学建模,1、高考报名问题2、包饺子问题3、骇鸟体重问题4、海战问题,1、高考报名问题,一个真实的案例某同学2014年高考分数为535,理科,现在面临报考志愿的问题,希望你能给他一些建议。有如下的参考资料:2014年河南高考录取分数线:文科理科,一个简单的方法,换算成去年的分数:,解出:,也就是说,这个分数相当于去年的494.5分。而连续两年之间的招生计划、高考人数等应该变化不大,可以参照去年的录取情况报考志愿。这里,我们就建立了一个简单的数学模型。,通常,1公斤面, 1公斤馅,包100个汤圆(饺子),今天,1公斤面不变
2、,馅比 1公斤多了,问应多包几个(小一些),还是少包几个(大一些)?,问题,圆面积为S的一个皮,包成体积为V的汤圆, 若分成n个皮,每个圆面积为s,包成体积为v,V和 nv 哪个大?,2.从包汤圆(饺子)说起,定性分析,V比 nv大多少?,定量分析,从包汤圆(饺子)说起,假设,1. 皮的厚度一样,2. 汤圆(饺子) 的形状一样,模型,应用,若100个汤圆(饺子)包1公斤馅,则50个汤圆(饺子) 可以包 公斤馅,R 大皮 半径,V是 nv是 倍,1.4,r 小皮半径,数学建模的一般步骤,模型准备,了解实际背景,明确建模目的,搜集有关信息,掌握对象特征,形成一个比较清晰的问题,模型假设,针对问题特
3、点和建模目的,作出合理的、简化的假设,在合理与简化之间作出折中,模型构成,用数学的语言、符号描述问题,发挥想像力,使用类比法,尽量采用简单的数学工具,数学建模的一般步骤,模型求解,各种数学方法、软件和计算机技术,如结果的误差分析、统计分析、模型对数据的稳定性分析,模型分析,模型检验,与实际现象、数据比较,检验模型的合理性、适用性,模型应用,数学建模的一般步骤,例3 骇鸟尺寸建模,大约7百万年前,北美洲出现了一种巨大的、不会飞的食肉鸟,称为“骇鸟”。它是已知存在的最大的猎食鸟。各种各样的骇鸟尺寸从59英尺不等。有一种叫“泰坦巨鸟”是最大的,但化石极少,所以其尺寸不清楚。已经估计出其身高在67英尺
4、,试试看能否用数学建模的方法获知有关“骇鸟”的更多信息。,首先,这个问题比较模糊。题目中只是要求我们“获知有关骇鸟的更多信息”,什么信息呢?题目中没有明说,需要我们自己去寻找。寻找问题,发现问题,提出问题的过程,是数学建模的第一个步骤,叫做“识别问题”。识别问题这一步通常比较困难。因为现实生活中,没有人简单给你一个有待解决的数学问题,通常要从大量数据中搜索及识别所研究问题的某些特定的方面。此外,还要把描述问题的口头陈述翻译成数学符号来表示。当然,骇鸟尺寸问题相对简单容易,通常要考虑其“体重”,第一步:识别问题,现在我们已经明确了要探究的问题:预测骇鸟的体重。进一步分析:如何进行预测?根据什么预
5、测?注意到我们只能得到一些化石,且“化石极少”。由于股骨(即大腿骨)支撑了身体的大部分体重,所以我们选择股骨的某个特征量,比如周长来预测。于是问题识别为:预测作为其股骨周长的函数的骇鸟的体重。,第二步:假设和变量,我们已经确定采用“股骨的周长”预测骇鸟的体重。股骨的周长和体重之间是一个什么样的函数关系呢?我们假定:骇鸟和当今的大鸟是几何相似的。由几何相似性的假设,我们得到骇鸟的体积和任何特征量的立方成正比:,如果我们假设体重密度不变,那么骇鸟的体积和其重量成正比:从而有由于我们选择股骨的周长作为特征量,这就给出了模型:,第三步:模型求解,由于这个模型比较简单,所以不存在求解问题。但是要注意,在
6、很多问题中常常会发现完成这一步,我们的准备还相当不够,或者可能得到一个不能求解或不会解释的难以处理的模型。遇到这种情况,我们应该回到第二步做出另外的简化假设,甚至回到第一步重新定义问题。,第四步:模型验证,我们利用各种鸟的尺寸的数据集检验模型。这是因为:1,我们有各种鸟的尺寸的数据集。2,骇鸟是鸟,所以这些数据是合适的。下面是股骨周长和鸟的体重的数据和对应的散点图:,散点图揭示其趋势是凹向上的增函数,w对 的图像:,因为我们建议的模型是 画出w对 的图像近似得到一条过原点的直线,因此有理由认为模型是精确的。,过原点的直线的斜率大约是0.0398,这就给出:下图是对原来的数据模型画图,第五步:模
7、型应用,测量得到骇鸟股骨的周长21cm,应用模型求得骇鸟体重约为368.58公斤,比例性和几何相似性,骇鸟尺寸建模问题中,用到了两个基本的假设:比例性和几何相似性。比例性和几何相似性是建模过程中常用的简化方法,比例性,定义:两个变量y和x是成比例的,如果一个变量总是另一个变量的常数倍,即对于某个常数k我们记为,例如,弹簧的伸长和弹簧末端质量的试验中,收集到如下数据:,散点图展现它是过原点的一条近似直线拟合得出 k=0.01625于是建立估算模型: e=0.01625m,做出散点图:,关于比例性的其他例子:,当且仅当,当且仅当,当且仅当,比例有传递性:,则,因此,与同一个变量成比例的所有变量成比
8、例,著名的比例性的例子:,虎克定律:F=kS,S是压缩或拉长的弦长,F是恢复力牛顿定律:F=ma,F是合外力,a是加速度欧姆定律:V=iR,V是电压,i是电流,R是电阻波尔定律:V=k/P,V是常温下的体积,P是压强质能方程:E=mc2,E是能量,m是质量光子能量:E=hu,E是能量,u是频率,几何相似性,定义:如果两个物体各点之间存在着一个一一对应,使得对应点之间的距离之比对所有可能点对都不变,则称这两个物体是几何相似的。例如:相似三角形之间、圆与圆之间、球与球之间、飞机模型和飞机之间都是是几何相似的总之,几何相似就是形状一样,等比例放大(或缩小),几何相似的性质,类似于相似三角形,一旦两个
9、物体是几何相似的,那么对应点之间的距离是成比例的。一旦规定了比例因子k,可以把表面积和体积的比例性通过某个选定的特征量表示出来。如果选择长度l作为特征量,由于,由于所以 对任何两个几何相似的物体成立即,例4 特拉法尔战斗,1805年法国、西班牙联军和英国海军作战,一开始法西联军有33艘战舰,英国有27艘战舰。在每一次遭遇战中,每一方的战舰损失都是对方战舰的10%。,动力系统模型:n表示战斗过程中遭遇战的阶段,表示第n阶段英军的战舰数,表示第n阶段法西联军的战舰数,经过11次战斗后,法西联军有18艘战舰,而英军有3艘战舰且至少一艘重伤。,分割并各个击败战略:,法军33艘战舰分为3个战斗编组,一字
10、排开:B=17,A=3,C=13,英军战略:用13艘迎战法军A组,另外14艘备用然后用战斗后存留下来的加上备用的迎战B组,最后所有剩下的迎战C组。,加设每次损失对方战舰数的5%(增加图解效果),结果如下:,利用分割并各个击败战略模型的预测结果与历史上真正发生的战斗结果类似。,一、概率的定义和概率模型的构成,假定已经确定了样本空间以及与之相联系的随机试验,对于每一个事件A,都有一个确定的实数P(A)与之对应,刻画它发生的可能性的大小,称为概率。概率是定义在事件(或集合)上的函数(通常称为测度)必须满足下面的几条公理:,(1)(非负性)对一切事件A,满足(2)(可加性)设A和B是两个互不相容的事件
11、(互不相交的集合),则他们的并满足 更一般的,若 是一个互不相容的事件序列,则他们的并满足(3)(归一性)整个样本空间(必然事件)的概率为1:,概率模型的构成:,样本空间:这是一个实验的所有可能结果的集合;概率:为实验结果的集合A(称之为事件)确定一 个非负数P(A)(称为事件A的概率)。这个非负数刻画了我们对事件A的认识或所产生的信念的程度。概率必须满足三条公理。,随机试验,事件A,事件B,事件,A,B,概率,样本空间(可能结果的集合),概率与频率,概率的更具体、更直观的解释是频率。比如P(A)=2/3,表示在大量重复试验中事件A出现的频率大约是2/3.实际应用中,可以用频率估算概率例:在某
12、本书中,一页内出现错误的次数为X,数据如下:,于是我们计算出频率,以估算概率:,概率的性质,概率的很多重要性质没有包含在公理系统中,因为它们可以从公理系统中推导出来。例如:,*一般情况,设 是任意n个事件,记其中 是个和式,每一项是从 n个事件中选取k个事件的交集的概率。,例1 给掷一枚硬币的试验建立概率模型。解:掷一枚硬币,有两个可能的结果:正面和反面。若用 表示正面, 表示反面,则样本空间为: 事件为:根据定义和性质,得到,概率建模实例:,如果硬币是均匀的,正面和反面出现的机会相同,于是由可加性和归一性知由此可得:于是概率为显然,这样建立的概率满足三条公理。,例2 为依次抛掷三枚硬币的试验
13、建立概率模型。解 用“1”表示正面向上,“0”表示反面向上,样本空间为: W=(1,1,1),(1,1,0),(1,0,1),(1,0,0),(0,1,1),(0,1,0),(0,0,1),(0,0,0)如果上述8种结果出现的可能性相同,根据可加性和归一性,每个结果的概率为 1/8.现利用三条公理建立概率:例如事件A表示“只有一次正面向上”,则A=(1,0,0), (0,1,0), (0,0,1),,于是 P(A)=P(1,0,0), (0,1,0), (0,0,1) = P(1,0,0)+P(0,1,0)+P(0,0,1)相似的,任何事件的概率等于1/8乘上该事件中包含的结果的个数。,补充:
14、 有一枚骰子,偶数边出现的概率比奇数边出现的概率大一倍,而不同偶数边出现的概率相同,不同奇数边出现的的概率也相同。将这枚骰子投掷一次,为这个试验建立概率模型,并求点数小于4的概率。解 设Ai表示“出现i点”,i=1,2,.,6,则样本空间为 根据可加性和归一性,有又根据题意,,得出 点数小于4的概率为:,例3 若A发生的概率为0.6,A与B都发生的概率为0.1,A与B都不发生的概率为0.15,求(1)A发生但B不发生的概率;(2)B发生但A不发生的概率;(3)A与B至少有一个发生的概率。解:样本空间可以用下面四个结果表示,由A发生的概率为0.6,得:A与B都发生的概率为0.1,得:A与B都不发
15、生的概率为0.15,得:结合归一化公式:得到:,于是:(1)A发生B不发生的概率为:(2)B发生A不发生的概率为:(3)A与B至少有一个发生的概率为:,二、生活中的概率模型,1、男女问题(两孩)2、打牌中的问题3、假阳性之谜4、三门问题5、赌徒破产问题,例1 中国的计划生育政策使很多家庭只能有一个小孩,部分家庭可以由两个小孩。在有两个小孩的家庭中,男孩女孩各一个比例非常大。请用概率的方法解释一下这种现象。解:男孩用B表示,女孩用G表示,样本空间为 W=BB, BG, GB, GG由于每种情况的可能性相等,故一男一女的概率为 0.5;而两个男孩或两个女孩的概率都是0.25,例2 在用两副牌“打升
16、级”的比赛中,如果某人拿了底牌后手中有红心“对k”,但没有红心A。问其余三个人甲、乙、丙中,手中有红心“对A”的可能性有多大?解 两副牌一共108张,其余三人一共有75张牌,所以基本事件的总数为甲拿红心“对k”的基本事件数:而甲、乙、丙拿红心“对k”是互不相容的三个事件,且可能性相同,因此所求概率为:,例3(假阳性之谜)设对于某种少见的疾病的检出率为0.95:如果一个被检验的人有某种疾病,其检验结果为阳性的概率为0.95,如果该人没有这种疾病,其检验结果为阴性的概率为0.95.现假定某一人群中患有这种病的概率为0.001,并从这个样本中随机抽取一个人进行检验,检查结果为阳性。现在问这个人患有这
17、种病的概率有多大?解:设A=“患有这种疾病”, B=“经检验此人为阳性”,,利用贝叶斯推断:尽管检验方法很精确,一个经检测为阳性的人仍然不大可能真正患有这种病。然而多数人不知道正确答案,大部分人认为这种情况患病概率为95%,你站在3个封闭的门前,其中一个门的门后有一个奖品。当然,奖品在哪个门后是完全随机的。当你选定一个门以后,你的朋友打开其余两扇门中的一扇空门,显示门后没有奖品。此时你可以有两种选择:保持原来的选择或改选另一扇没有被打开的门。当你做出最后选择以后,打开的门后有奖品,这个奖品就归你的了。现在有3种策略:,例4 (三门问题),(a)坚持原来的选择;(b)改选另一扇没有被打开的门;(
18、c)你首先选择1号门,当你的朋友打开2号空门,你不改变主意。当你的朋友打开的是3号空门,你改变主意,选择2号门。最好的策略是什么呢?现在计算在各种策略下赢得奖品的概率:在策略(a)之下,你的初始选择会决定你的输赢。由于奖品的位置是随机确定的,得奖的概率是1/3,在策略(b)之下,如果奖品的位置在原来指定的门后(概率为1/3),由于改变了主意,因而失去了获奖的机会。如果奖品不在你原来指定的门后(概率为2/3),而你的朋友又将没有奖品的那一扇门打开,当你改变选择时,改变选择后所指定的门后一定有奖品。所以获奖的概率为2/3.(b)比(a)好。在策略(c)下,由于提供的信息不够充分,还不能确定赢得奖品
19、的概率。答案依赖于朋友打开空门的方式。先讨论两种情况:,第一种情况:当奖品的位置在1号门后,假定你的朋友总是打开2号空门(当奖品在2号或3号门后时,你朋友没有选择的余地)如果奖品在1号门后(概率1/3),朋友打开2号门,你不改变主意,得到奖品。如果奖品在2号门后(概率1/3),朋友打开3号空门,你改变主意,得到奖品。如果奖品在3号门后(概率1/3),朋友打开2号空门,你不改变主意,失去奖品。这样,获奖机会是2/3.,第二种情况:假定奖品在1号门,朋友随机打开2号门或3号门(概率各为1/2),如果奖品在1号门后(概率1/3), 当朋友打开2号门时,按照策略(c),不改变主意,得到奖品(概率1/6
20、)。但是若朋友打开3号门,此时你改变主意,失去了得奖机会。如果奖品在2号门后(概率1/3),朋友将打开3号空门,按照策略改变主意,赢得奖品。,如果奖品在3号门后(概率1/3),朋友将打开2号空门,按照策略不改变主意,失去奖品。综合来看,赢得奖品的概率为1/6+1/3=1/2,此时,策略(b)比策略(c)差。,例5 (赌徒破产问题)一个赌徒进行一系列相互独立的押注活动,每次押注,他以概率p赢1元钱,以概率1-p输1元钱。开始押注时他有k元钱,当他输光钱的时候,或他的累计钱数为n元的时候,他就停止押注。问他以累计钱数为n元而停止押注的概率有多大解 事件A表示累计钱数为n元而停止押注, 事件F表示第
21、一次押注赢得1元钱, wk表示他开始的时候有k元钱的条件下事件A发生的概率,利用全概率公式,有:,利用过去押注结果和以后的押注结果是相互独立的,第一次押注赢得1元钱,故类似的这样我们得到这个结果可以写成其中利用这个递推公式和边界条件可以解得,从而得到:上面的和可以分成r=1 (p=q)和r1(pq)两种情况计算出来,得到:由于 利用上式得到,从而下面是n=100时,不同的r对应的w和k的关系图:,r=0.5,r=0.93,r=0.98,r=1,r=1.02,r=1.05,r=1.5,当rq 时,随着k的增加wk很快接近1,当r1,即p P(A1|B),我们判断此样本属于A2,也就是属于Apf。
22、但实际上更一般的考虑,我们可以设定一个阀值(临界值),若P(A1|B) 则认为样本属于A1,也就是Af类。若取0.5,就是上面的判断。根据不同要求, 可以取其他的值,如0.9,0.1等等。,4、阀值(临界值)的选取,并进行讨论,选定的值进行上述判断时,冒着犯两类错误的风险:第一类错误是将Apf类误判为Af类;第二类错误是将Af类误判为Apf类。阀值的选取依赖于把Apf类误判为Af及把Af类误判为Apf类的概率。现将两类错误分析如下:,(1)Apf类正误判。把Af类识别为Apf类.根据我们的判断方法,发生这种错误时,一定是p ,并且样本属于Af类。因此,其概率为:同理, (2)Apf类负误判。把
23、Apf类识别为Af类,概率为:,误判概率的计算,1、根据二重积分的定义,采用分割、近似、求和的方法。首先把积分区域分割成小矩形;每个小矩形与密度函数构成的小曲顶柱体用立方体近似,立方体的高等于小矩形上的密度函数值;然后求和得出近似值。分割的越细密,近似程度越高。2、为了方便计算,可以用一个较大的矩形区域作为积分区域,而把被积函数定义为如下形式:,经过这样处理之后,就可以用matlab编程计算。3、Apf负误判的概率可以类似的求得。4、两种误判都受阀值的选取以及总比值r的制约。由假设(2)知,r可取1或1.5,的选取,分别取r=1和1.5,用不同的阀值a试验,计算出两类犯错概率如下表:由表可见,
24、当阀值为0.5时,不论a=1还是1.5,正、负误判的概率都小于3%,因而两者的分布明显分开,可以作为判断Apf类或Af类的准则,5、模型的检验:,只有(1.28,1.84)在两种群数量比由1变为1.5时改变了类别。对此我们需要进一步检验。上文计算,犯两类错误的概率低于3%,两种群的分布应明显分开,可见(1.28,1.84)落在f,g的末尾处。发生这种情况的概率并不大。,函数p(x,y)图像:,可以看出,p在最大值和最小值附近变化不大,比较平滑,取介于最大值和最小值之间的值只是在一个较小的区域内,在这个区域内p值不稳定。f,g函数大部分落在p的稳定区域内,所以,根据p来检验是可行的。,5、模型的
25、修改:,(3)设Af是传播益虫,Apf是某种疾病的载体,是否应该修改你的分类方法?若需要修改,为什么?这个问题只需要对阀值做出修改即可。,(1)如果Apf是某疾病的载体,Af是益虫,模型做何修改?若Apf危害极大,务必消除,则取a=0.01,将消灭100%的Apf,而消灭10.9%的Af(2)如果Af为传粉益虫,是珍稀动物,需重点保护,则可取a=0.9,可以消灭90.8%的Apf,而消灭不超过1%的Af,利用这种思想,在不同情况下,对于不同的试验目的可以通过阀值的不同选取来实现。,谢谢大家!,散点图,xaf=1.24 1.36 1.38 1.38 1.40 1.48 1.38 1.54 1.56 ;yaf= 1.72 1.74 1.64 1.90 1.70 1.82 1.82 1.82 2.08;xapf=1.14 1.18 1.20 1.26 1.28 1.30 ;yapf= 1.78 1.96 1.86 2.00 2.00 1.96;plot(xaf,yaf,*,xapf,yapf,+),
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。