概率统计与计算机技术的联系及在生活当中的应用研究


title: 概率统计与计算机技术的联系及在生活当中的应用研究
date: 2023-05-16 11:42:26
tags:


题目:概率统计与计算机技术的联系及在生活当中的应用研究

摘 要

概率论与数理统计是研究随机现象统计规律性的一门学科,是理工科各专业的一门重要的基础课程,一方面,它有别开生面的研究课题,有自己独特的概念和方法,内容丰富,结果深刻;其理论方法独特、抽象,既有严密的数学基础,又与众多学科有着密切的联系。随着科学技术,尤其是计算机的迅速发展,它已广泛应用于经济管理、工程技术、金融、生物、环境、国防等领域。

**关键词:**概率统计;日常生活;应用;统计规律;数学;计算机技术;

**
**

一、引言

概率统计以自然界的随机现象为研究对象,它与人们的日常生活有着密切的联系.结合具体生活实际,对概率统计的应用进行全面分析,有利于增强人们行动的自觉性,防止上当受骗.文章主要结合具体实例,通过计算分析得出相应的结论,以更好地指导人们的日常行动.

二、概率统计

概率统计是一种研究自然界中随机事件统计规律的数学方法,它包括概率论和统计学。概率是概率论的基本概念,又可以称作或然率、机会率、机率(几率)或可能性。概率是对随机事件发生的可能性的一种估量。一般情况下,在0到1之间的实数代表着一个事件发生的可能性大小。该事件越接近1越有可能发生;越接近0越不可能发生。比如一个没有复习到位的人能有百分之多少的把握能顺利通过考试,或者抛硬币等这些都是属于概率问题。统计是一门以概率论为理论基础与数据有关的学问,它是一种通过描述数据特征从而探索数据规律的方法。一个学校的升学和就业情况、学生体能测试结果、公司的经营成本和收益等都是与统计有关系的。生活和工作中处处充满着概率数据,概率统计与人们的实际生活有着密切的联系,并对日常生活生产和科学研究等起着越来越重要的作用。生活中的概率统计问题有时出乎人们的预料,但了解概率统计在----实际生活中的应用,根据概率统计透过事情现象看到本质,我们就可以简单地去解决生活中的一些问题。

三、随机数与伪随机数的生成

3.1在生活中,最困扰人们的一个问题就是如何做出一个无关痛痒、随意的选择―-随机数。随机数最重要的特性是它在产生时后面的那个数与前面的那个数毫无关系,因而可以给人们一种下一状态不可测的感觉,广泛地应用于抽奖、密码学中。真正的随机数是使用物理现象产生的:比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变等等。在真正关键性的应用中,比如在密码学中,人们一般使用真正的随机数,这样的随机数生成器属于物理性随机数生成器,但是对技术的要求比较高。所以在实际应用中往往使用伪随机数就足够了。这些数列是“似乎”随机的数,实际上它们是通过一个固定的、可以重复的计算方法产生的。它们并不真正地随机,因为它们实际上是可以计算出来的,但是它们具有类似于随机数的统计特征。这就是伪随机数生成器,按一定的算法和种子值生成。

3.2而在计算机中, 还可以通过梅森旋转算法快速产生高质量的伪随机数。通常使用两个相近的变体,不同之处在于使用了不同的梅森素数。一个更新的和更常用的是MT19937,32位字长。还有一个变种是64位版的MT19937-64。对于一个k位的长度,梅森旋转算法会在[0,2k-1]的区间之间生成离散型均匀分布的随机数。伪随机数的一个特别大的优点是它们的计算不需要外部的特殊硬件的支持,因此在计算机科学中伪随机数依然被使用。真正的随机数必须使用专门的设备,比如热噪讯号、量子力学的效应、放射性元素的衰退辐射,或使用无法预测的现象,譬如用户按键盘的位置与速度、用户运动鼠标的路径坐标等来产生。

3.3蒙特卡罗方法的计算机实现

蒙特卡罗方法, 是一种使用随机数, 或更常见的伪随机数来解决很多计算问题的方法,也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。蒙特卡罗方法在金融工程学,宏观经济学,生物医学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域应用广泛。

当所求解的问题本身具有内在的随机性,借助计算机的运算能力可以直接模拟这种随机的过程,例如在核物理研究中,分析中子在反应堆中的传输过程。而当所求解问题可以转化为某种随机分布的特征数,比如随机事件出现的概率,或者随机变量的期望值。通过随机抽样的方法,以随机事件出现的频率估计其概率,或者以抽样的数字特征估算随机变量的数字特征,并将其作为问题的解。这种方法多用于求解复杂的多维积分问题。

假设我们要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算(比如积分)的复杂程度是成正比的。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。借助计算机程序可以生成大量均匀分布坐标点,然后统计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。通过一些数学上的关系和计算公式,可以计算出一些特殊常数、参数的数值。

此外对一些难以直接计算出的积分也可以使用此方法来估算,对被积函数变量区间进行随机均匀抽样,然后对被抽样点的函数值求平均,从而可以得到函数积分的近似值。此种方法的正确性是基于概率论的中心极限定理。当抽样点数为m时,使用此种方法所得近似解的统计误差只与m有关,不随积分维数的改变而改变。因此当积分维度较高时,蒙特卡罗方法相对于其他数值解法更优。

四、计算机数学软件与数理统计

在回归分析中,两个随机变量X,Y之间存在着某种相关关系,尤其在物理实验中,常常通过作图法得到一条直线,其斜率的值是一个包含所测物理常量的表达式,从而得出所测物理量。常见的就是一种线性关系,通过最小二乘法来逼近和拟合,可以近似的得到X,Y之间的线性关系。

而通常的作图由于人眼本身的局限性,较难十分准确的做出最小二乘下的拟合直线,存在偏差,而直接使用最小二乘法计算有十分繁杂,从而有了数学软件的使用, 如MATLAB等, 可以十分方便地得出拟合曲线方程的各个参数。极大地减少了人的工作量,并且精确性也较高。

**五、**计算机技术对概率论和数理统计的贡献具体例子

计算机科学与技术的发展极大地促进了概率论、数理统计方面工作的进步,大大提高了解决此类问题的效率与准确度,减少了计算上的复杂度。并且人们可以利用计算机程序来模拟现实生活中难以进行或者重复性较高的试验,(如模拟演示投掷硬币的试验)从而得出一个可以接受的结果,作为实验的数据,得出一个较为可靠的结论。

计算机模拟演示DeMovire-Laplace中心极限定理。通过选取不同的参数n,演示随机序列前n项和的分布逐步趋向正态分布的过程。若随机变量X~B(n,p),(0<p<1)的二项分布,则随着n的增大,X近似服从参数为np和np(1-p)的正态分布;以及局部极限定理的结论,即X在某一点的概率近似等于在该点的正态分布的密度函数值。

中心极限定理中,对于独立同分布的随机变量X1,X2,X3…Xn,E(Xi)=μ,D(Xi)=σ2,i=1,2,⋯有

img

即这些随机样本的均值总是围绕在总体均值周围,且分布近似呈正太分布

则可以利用PYTHON采用对中心极限定理进行简单验证具体实例过程如下:

文本框: import matplotlib.pyplot as plt import math import random as rd n=30  ##单次试验的样本数量 epoch=1000  ##试验次数 res=[0]*(n+1) for i in range(epoch):     average=0     for j in range(n):         average+=math.sin(rd.random()*math.pi/2)     res[round(average)]+=1   # 显示高度 def autolabel(rects):     for rect in rects:         height = rect.get_height()         plt.text(rect.get_x()+rect.get_width()/2.- 0.2, 1.03*height, '%s' % int(height))   name_list = range(0,n+1) num_list = res autolabel(plt.bar(range(len(num_list)), num_list, color='rgb', tick_label=name_list)) plt.show()

得到下图

IMG_256

从上图的运行结果来看当前结果已经和理论值非常接近了,能够做到简单验证中心极限定理

可见,计算机能够使得概率论的试验更为简便,并且能够演示一些较为抽象概念和理论,加深我们的理解,为理论证明提供了强有力的工具和方法。

**六、**概率统计在计算机技术中的具体应用例子

计算机中的模式识别,是通过计算机数学技术方法来研究模式的自动处理和判读。

而在这其中应用到的贝叶斯决策,就是在贝叶斯公式计算出后验概率的基础上,进一步做归属的决定——分类,根据观测对样本做出应该归属于哪一类的决策。

其中所利用到贝叶斯公式的思想和理论:

img
代表样本X在某一类别ωi 中出现的概率,该样本也可能出现在其它的类别中,记作条件概率,是在特定类别这个条件下出现的概率。

当根据经验及有关材料推测出主观概率后,对其是否准确没有充分把握时,可采用概率论中的贝叶斯公式进行修正,修正前的概率称为先验概率,修正后的概率称为后验概率

· 后验概率:
img

· img

· 其中P(X)表示样本X在所有类别中出现的概率之和最大

·

贝叶斯决策其中主要包括两种决策方式,即最小错误贝叶斯决策,和最小风险贝叶斯决策。前者是在比较理想或者各类类别地位均等的情况下的决策,而后者则要考虑决策本身带来的代价和各类别地位的不均等。

最小错误贝叶斯决策:

在一般的模式识别问题中,人们往往希望尽量减少分类的错误,即目标是追求最小错误率。从最小错误率的要求出发,利用概率论中的贝叶斯公式,就能得出使错误率最小的分类决策,称之为最小错误率贝叶斯决策。

将损失定义为0-1损失

                         ![img](https://farsblog.oss-cn-beijing.aliyuncs.com/PicGo/202305161136655.gif)

化简条件风险

img

选择后验概率最大的分组或者类,则判断正确的可能性就是最大的,进而犯错的概率就是最小的,即最小错误贝叶斯决策 = 最大后验贝叶斯决策。由于概率非负,如果每一次决策错误率都最小,那么总的错误率也是最小的。

最小风险贝叶斯决策:

据具体的场合不同,我们应关心的有可能并不仅仅是错误率,而是错误所带来的损失,同样,在癌细胞识别的例子中,我们不但应该关心所作的决策是否错误,更应该关心决策错误所带来的损失或风险。比如,如果把正常细胞误判为癌细胞,会给病人带来精神上的负担和不必要的进一步检查,这是一种损失﹔反之,如果把癌细胞误判为正常细胞,则损失更大,因为这可能会导致病人丧失了宝贵的早期发现癌症的机会,可能会造成影响病人生命的严重后果。将这两种类型的错误一视同仁来对待,在很多情况下是不恰当的。

设对于实际状态为wj的向量x采取决策αi所带来的损失为

img

计算出条件风险:

img

选择风险最小的决策:

img

选择决策风险最小的分组或者类,当不同的决策所带来的的代价不相同时,我们会为每个决策添加不同的权重

可见,概率统计在计算机技术中的应用有着至关重要的地位,在模式识别可以通过贝叶斯决策作为最优的决策,可以使决策的错误率达到最小,或者是其他设定规则下的最优结果。除此之外,概率统计还应用在计算机技术的其他方方面面。

七、研究概率统计在实际生活中的应用意义

概率统计与人们的日常行为有着密切的联系,人们在日常生活中随时随地都会与概率统计打交道.例如,保险行业、抽奖活动、生活游戏等等,都会出现概率统计的知识,而一些消费者如果缺乏概率统计的相关知识,往往会作出不理性的选择,对自己造成不利影响.事实上,在这些活动中,商家往往会利用概率统计的有关内容,再加上一些消费者抱有侥幸心理,认为通过概率统计的内容,自己会侥幸成为幸运者,而商家却获取巨大的利润.因此,结合具体的生活实际,探讨分析概率统计问题,有利于全面认识某些活动的本质现象,进而增强人们日常行为的自觉性,使人们在从事某种消费活动的时候作出更为理性的选择,从而维护自己的正当利益,避免发生不必要的损失.

八、总结

我们的日常生活生产和工作中处处充满着概率统计,与此同时概率统计理论与方法的应用也遍及计算机科学与技术领域。概率统计的应用范围是十分广泛的,它可以帮助我们提高彩票中奖率、计算考卷分数和面试通过率、了解体育比赛中的可能性和促进产品的促销等方方面面。虽然我们不能准确的预测一个事情在将来发展的情况,但利用概率统计,我们能更好地去处理不确定的因素与可能,为我们的生活生产和工作带来便利。因此我们要学好概率统计,对生活中的某些偶然事件做出理性的分析,从而充分发挥概率统计的指导作用,也为人类的发展做出自己的一份贡献。

参考文献

[1]论概率统计方法在教学中的应用[J]. 何林海. 湖北开放职业学院学报. 2019(03)

[2]分层教学为主的《概率论与数理统计》的教学研究[J]. 汤文菊,方成鸿,方小洪. 内江科技. 2020(03)

[3]概率统计方法在我国人口统计研究中的应用初探[J]. 刘珠. 当代经济科学. 1993(04)

[4]概率统计方法的应用案例研究[J]. 姜丽颖,张国林. 教育现代化. 2019(81)

[5]基于概率统计方法确定油滴电荷量[J]. 冯德军,鲁晓东,傅武伟,费玉良,黄孝肖. 科技资讯. 2011(01)

[6]客观现象的概率统计解释举例[J]. 苑延华,徐莹,陈洪海. 价值工程. 2011(15)

[7]模式识别(第三版)[M]. 张学工. 2010年8月第3版. 北京清华大学:清华大学出版社, 2010

猜你喜欢

转载自blog.csdn.net/qq_35798433/article/details/130702358