生物统计的基本理论课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计的基本理论课件.pptx》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 基本理论 课件
- 资源描述:
-
1、第三章 生物统计的基本理论第一节 总体、样本与误差 近代数理统计方法的发展和在科学研究中的应用,特近代数理统计方法的发展和在科学研究中的应用,特别是电子计算机技术的发展别是电子计算机技术的发展,使试验研究的试验手段、方使试验研究的试验手段、方法、设计和数据处理又进入了现代化新阶段。法、设计和数据处理又进入了现代化新阶段。Z2020世纪世纪2020年代:费休(年代:费休(R.FisherR.Fisher)提出了的方差分析和)提出了的方差分析和随机区组设计;叶次(随机区组设计;叶次(YatesYates)提出了混杂设计和复因素)提出了混杂设计和复因素试验。试验。Z2020世纪世纪3030年代:田间
2、复因子试验开始在欧美实施。年代:田间复因子试验开始在欧美实施。Z2020世纪世纪5050年代后:随着电子计算机技术的发展年代后:随着电子计算机技术的发展,试验设试验设计逐步向复杂化和高级化发展。回归正交设计、回归旋转计逐步向复杂化和高级化发展。回归正交设计、回归旋转设计、回归最优设计、混料设计逐渐用于科学研究的试验设计、回归最优设计、混料设计逐渐用于科学研究的试验设计,也成为环境研究的重要方法设计,也成为环境研究的重要方法.生物统计方法的发展生物统计方法的发展1 1 总体:总体:同质同质事物的全体,或所要研究事物的全部个事物的全体,或所要研究事物的全部个体构成的集合。体构成的集合。总体:有限总
3、体和无限总体总体:有限总体和无限总体2 2 样本:样本:从总体中抽出用于研究总体特征或性质的部从总体中抽出用于研究总体特征或性质的部分个体构成的集合。分个体构成的集合。样本:大样本样本:大样本-个体数个体数3030 小样本小样本-个体数个体数3030例如:研究某一地区耕地土壤中的Cd含量(总体),则从该地区选取若干个地块为样本,每个地块土壤Cd含量则为一个个体。误差:误差:观察值与真值之间的差异。观察值与真值之间的差异。系统误差:由某个或某些固定因素引起的误差。系统误差:由某个或某些固定因素引起的误差。特点:误差的性质和符号恒定不变特点:误差的性质和符号恒定不变 可以预见和消除可以预见和消除
4、结果的统计分析不一定能发现结果的统计分析不一定能发现随机误差:由不可预见的偶然因素引起的误差。随机误差:由不可预见的偶然因素引起的误差。特点:误差的符号随机出现,或正或负特点:误差的符号随机出现,或正或负 不可预见,不能消除,但可减少不可预见,不能消除,但可减少 正负相抵,具有补偿性正负相抵,具有补偿性疏失误差:由疏忽大意、操作不正确等主观因素引起疏失误差:由疏忽大意、操作不正确等主观因素引起的误差。的误差。特点:完全可以消除特点:完全可以消除变量:变量:同一总体中个体间具有变异的每种性状或特征,同一总体中个体间具有变异的每种性状或特征,在数量上可以表现为不同的数值,这个因个体不同在数量上可以
5、表现为不同的数值,这个因个体不同而变化的量在统计学中称为变量。而变化的量在统计学中称为变量。观察值:观察值:不同个体的某一性状具体表现的数值。不同个体的某一性状具体表现的数值。连续变量:总体中相邻两个变量的差值可无限小者。连续变量:总体中相邻两个变量的差值可无限小者。不连续变量:相邻两个变量的之差最小为不连续变量:相邻两个变量的之差最小为1 1 者。者。变量可以分为:变量可以分为:总体特征数:总体特征数:说明总体中个体间集中性和分散性说明总体中个体间集中性和分散性(变异性)(变异性)特征的数值,称为特征的数值,称为总体特征数总体特征数或或参数参数。样本特征数:样本特征数:由样本的不同个体观察值
6、计算出的反映样本由样本的不同个体观察值计算出的反映样本集中性和分散性集中性和分散性(变异性)(变异性)特征的数值,又特征的数值,又称统计值,称统计值,可作为总体特征数的估计值。可作为总体特征数的估计值。总体特征数:总体特征数:平均数、极差、方差、标准差、变异系数等平均数、极差、方差、标准差、变异系数等1 1 算术平均数算术平均数1 1)总体算术平均数:总体算术平均数:一个具有一个具有N N个个体的总体,其观察个个体的总体,其观察值为值为x x1 1,x x2 2,x xN N,则该总体的算术平,则该总体的算术平均数均数为:为:=(x x1 1+x+x2 2+x+xN N)=x xi i。1N1
7、NNi=12 2)样本算术平均数:样本算术平均数:一个具有一个具有n n个个体的样本,其观察个个体的样本,其观察值为值为x x1 1,x x2 2,x xn n,则该样本的算术平,则该样本的算术平均数均数 x x 为:为:x=x=(x x1 1+x+x2 2+x+xn n)=x xi i。1n1nni=13 3)算术平均数性质:算术平均数性质:(1 1)各观察值与算术平均数之差(离均差)总和等于零:)各观察值与算术平均数之差(离均差)总和等于零:(x-x)=0(x-x)=0(2 2)离均差的平方和最小:)离均差的平方和最小:(x-x)(x-x)2 2 的值最小的值最小3 3)算术平均数的计算方
8、法:算术平均数的计算方法:(1 1)直接法:)直接法:(2 2)加权法:)加权法:如果观察值有重复数值出现,使各观如果观察值有重复数值出现,使各观察值察值x xi i有不同的比重有不同的比重f fi i,且且 f f1 1+f+f2 2+f+fn n=n,=n,则平均数:则平均数:x=x=(f f1 1x x1 1+f+f2 2x x2 2+f+fn nx xn n)=fix xi 1n1nni=1例:例:分析表明菠菜根、茎、叶的重量分别为:分析表明菠菜根、茎、叶的重量分别为:2.3g2.3g,4.2g4.2g,6.0g6.0g;其农药残留量分别为:;其农药残留量分别为:400mg/kg400
9、mg/kg,790mg/kg790mg/kg,500mg/kg500mg/kg。问菠菜的平均农药残留量?。问菠菜的平均农药残留量?x=x=(2.32.3400+4.2400+4.2790+6.0790+6.0500500)=579.0=579.0mg/kgmg/kg112.52 2 中数中数 总体或样本的各观察值按大小顺序排列,排在中间总体或样本的各观察值按大小顺序排列,排在中间位置的数据即为中数。位置的数据即为中数。如果观察值的个数为奇数,则中数为排在中间位置的数;如果观察值的个数为奇数,则中数为排在中间位置的数;如果观察值的个数为偶数,则中数为排在中间两数的均值。如果观察值的个数为偶数,则
10、中数为排在中间两数的均值。3 3 众数众数 观察值中出现频率最大的数,或出现次数最多的一观察值中出现频率最大的数,或出现次数最多的一组的中值。组的中值。中数和众数一样只用于对事物的一般描述,而不能用于统计分析。中数和众数一样只用于对事物的一般描述,而不能用于统计分析。4 4 几何平均数几何平均数 如果总体或样本有如果总体或样本有n n个观察值,其乘积开个观察值,其乘积开n n次方所得次方所得的数值,即为几何平均数。记为的数值,即为几何平均数。记为G G。G=x1x2x3xn=(x1x2x3xn)n1n例:例:育种工作者,用几何平均数从两个蕃茄亲本果重:育种工作者,用几何平均数从两个蕃茄亲本果重
11、:P P1 1=10.36g=10.36g,P P2 2=0.45g=0.45g,预测,预测F1F1的果重。结果为:的果重。结果为:G=P1P2 =(10.36 0.45)=2.16(g)(g)125 5 调合平均数调合平均数 各个观察值倒数平均数的倒数。各个观察值倒数平均数的倒数。H=1n1x11x21xn(+)11n1x1H=513181614(+)1131例:例:毛管水在土壤中的上升速度,第毛管水在土壤中的上升速度,第1 1个个10cm10cm为为8cm/min8cm/min,第,第2 2个个10cm10cm为为6cm/min6cm/min,第,第3 3个个10cm10cm为为4cm/m
12、in4cm/min,求其平均速度。,求其平均速度。6 6 样本平均数的作用样本平均数的作用1 1)反映样本某一性状的集中趋势。)反映样本某一性状的集中趋势。2 2)作为样本性状的代表,可与另一同质样本进行比较。)作为样本性状的代表,可与另一同质样本进行比较。3 3)总体平均数的估计值,用于同质总体的比较。)总体平均数的估计值,用于同质总体的比较。1 1 极差极差总体或样本观察值中最大值与最小值之差。总体或样本观察值中最大值与最小值之差。R=maxxR=maxx1 1,x x2 2,x xn n-minx-minx1 1,x x2 2,x xn n 2 2 方差方差离均差的平方和的平均数。离均差
13、的平方和的平均数。=2(x-)(x-)2 2N N总体方差:总体方差:s=2(x-x)(x-x)2 2n-1n-1样本方差:样本方差:3 3 标准差标准差方差的正平方根。方差的正平方根。总体标准差:总体标准差:样本标准差:样本标准差:=(x-)(x-)2 2N N s=(x-x)(x-x)2 2n-1n-1标准差的计算方法:标准差的计算方法:1 1)直接法:)直接法:2 2)间接法:)间接法:(x-x)(x-x)2 2=(x(x2 2-2xx+x-2xx+x2 2)=x x2 2-2x-2xx +x +x x2 2=x x2 2-2 -2 x +x +n()2x xn nx xn n=x x2
14、 2-2 +-2 +(x x)2 2n n(x x)2 2n n=x x2 2-(x x)2 2n n3 3 变异系数变异系数标准差占平均数的百分率。标准差占平均数的百分率。CV(%)=sx x100例:例:重金属污染田小麦产量:重金属污染田小麦产量:250kg/mu;250kg/mu;标准差:标准差:28kg/mu28kg/mu 无污染田小麦产量:无污染田小麦产量:400kg/mu;400kg/mu;标准差:标准差:30kg/mu30kg/mu 问:问:哪种田块小麦产量变异程度大?哪种田块小麦产量变异程度大?CV(%)=30400400100=7.5%无污染田无污染田CV(%)=282502
15、50100=11.2%污染田污染田1 1 事件事件必然事件:必然事件:在一定条件下,必然发生的现象称为在一定条件下,必然发生的现象称为必然事件必然事件。不可能事件:不可能事件:在一定条件下,必然不发生的现象称为在一定条件下,必然不发生的现象称为不可能事件。不可能事件。随机事件:随机事件:在一定条件下,可能发生,也可能不发生的现象称为在一定条件下,可能发生,也可能不发生的现象称为随机随机事件事件,简称简称事件事件。2 2 频率频率定义:定义:在大量重复试验中,某一事件已发生的次数占试验总次数的比率在大量重复试验中,某一事件已发生的次数占试验总次数的比率。(n)A=n特点:特点:一个事件的频率不是
16、常数,但随一个事件的频率不是常数,但随重复试验或观察次数重复试验或观察次数n n增加增加,频率频率的波动会不断减小,逐步趋于稳定,此称为频率的稳定性。的波动会不断减小,逐步趋于稳定,此称为频率的稳定性。3 3 概率概率定义:定义:同一条件下,试验或观察次数同一条件下,试验或观察次数n n无限增大,随机事件无限增大,随机事件 A A 发生的频率发生的频率/n必然稳定接近某一常数必然稳定接近某一常数P P,P P就称为随就称为随机事件机事件A A的概率。的概率。性质:性质:1 1)0 P0 P(A A)11 2 2)P P(A A)=1=1,表明该事件为必然事件;,表明该事件为必然事件;P P(A
17、 A)=0=0,表明该事件为不可能事件;,表明该事件为不可能事件;0 P 0 P(A A)11,表明该事件为随机事件。,表明该事件为随机事件。取值:取值:一般情况下一般情况下P P的取值不可能准确获得,以的取值不可能准确获得,以n n充分大时事充分大时事件件 A A 发生的频率发生的频率/n/n作为作为P P的近似值。的近似值。运算法则:运算法则:1 1)若事件)若事件A A的概率为的概率为P P(A A),那么其对立事件),那么其对立事件B B的概的概率为:率为:P P(B B)=1-P=1-P(A A)2 2)若事件)若事件A A和和B B是互斥的,其概率各为是互斥的,其概率各为P P(A
18、 A)和)和P P(B B),那么两事件的和事件的概率为:),那么两事件的和事件的概率为:P P(A+BA+B)=P=P(A A)+P+P(B B)3 3)若事件)若事件A A和和B B是独立的,其概率各为是独立的,其概率各为P P(A A)和)和P P(B B),那么两事件同时出现的概率为:),那么两事件同时出现的概率为:P P(A AB B)=P=P(A A)P P(B B)1 1 概念概念-()2(X)=e121 x-2 1)概念)概念 正态分布随机变量的概率密度函数正态分布随机变量的概率密度函数(X)为:为:式中:式中:xx正态分布中的随机变量;正态分布中的随机变量;e2.718 e2
展开阅读全文