生物统计学之假设检验_第1页
生物统计学之假设检验_第2页
生物统计学之假设检验_第3页
生物统计学之假设检验_第4页
生物统计学之假设检验_第5页
已阅读5页,还剩88页未读, 继续免费阅读

下载本文档

kok电子竞技权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

kok电子竞技:文档简介

11三月2024生物统计学之假设检验

上节重点回顾分析题意提出假设确定显著水平计算检验统计量作出推断假设检验的步骤:1、提出假设无效假设/零假设/检验假设备择假设/对应假设

0

0

>0

<

0误差效应处理效应H0HA2、确定显著水平

=0.05显著水平*极显著水平**能否定H0的人为规定的概率标准称为显著水平,记作

。统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平

。P<

=0.01

=0.053、选定检验方法,计算检验统计量,确定概率值u=x-

x

136-126=√40=1.581P(u>1.581)=2×0.0571=0.1142根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例:4、作出推断结论:是否接受假设P>

P<

小概率原理接受H0否定HA否定H0接受HA可能正确可能错误

0P(-1.96x<x<

+1.96

x)=0.95-1.96x+1.96x0.950.0250.025临界值:+u

x左尾右尾否定区否定区接受区u

+1.96x双尾检验与单尾检验

0P(-2.58x<x<

+2.58

x)=0.99-2.58x+2.58x0.990.0050.005临界值:+2.58x左尾右尾双尾检验(two-sidedtest)否定区否定区接受区0.950.950.050.051.64-1.64H0:≤0HA:>0假设:否定区H0:≥0HA:<0左尾检验右尾检验单尾检验(one-sidedtest)接受区接受区u0.05=1.64u0.01=2.33单尾检验分位数双尾检验分位数u0.05=1.96u0.01=2.58

2否定区否定区否定区接受区接受区查表时,单尾概率等于双尾概率乘以2>大样本平均数的假设检验--u检验小样本平均数的假设检验--t检验单样本双样本一、一个样本平均数的假设检验样本平均数的假设检验适用范围:检验某一样本平均数x所属的总体平均数

是否和某一指定的总体平均数

0相同。若相同,则说明该样本属于这个以

0为平均数的指定总体;若不相同,则说明该样本所属的总体与这个指定总体(

0)不同,即有显著或极显著差异。3、总体方差σ2未知,且n<30时,可用样本方差s2来代替总体方差σ2,采用df=n-1的t检验法总体(μ0)样本(n<30)x

s2σ2例:已知某玉米单交种群的平均穗重为300g,经喷药处理过得玉米种群随机抽取9个果穗,其穗重分别为308,305,311,298,315,300,321,294,320g,问喷药与否的果穗重差异是否显著?分析(1)这是一个样本平均数的假设检验,因总体σ2未知,n=9<30,可用s2代替σ2进行t检验;

(2)喷药处理后的玉米果穗重可能>或<多年平均值,用双尾检验。(1)假设(2)水平(3)检验(4)推断H0:μ=μ0=300(g),即认为喷药与否的果穗重没有显著差异。HA:μ≠μ0选取显著水平α=0.05在0.05显著水平上,拒绝H0,接收HA;认为喷药与否的果穗重有显著差异。t0.05(8)=2.306tn-1>t0.05P<0.05二、两个样本平均数的假设检验样本平均数的假设检验适用范围:检验两个样本平均数x1和x2所属的总体平均数

1和

2是否来自同一总体。样本1X1样本2X2总体1μ1

总体2μ2两个样本平均数的假设检验步骤1、提出假设无效假设H0:μ1=μ2

,两个平均数的差值是随机误差所引起的;备择假设HA:μ1=μ2

,两个平均数的差值除随机误差外还包含其真实的差异,即由处理引起的;2、确定显著水平:0.05或0.013、检验统计量(1)样本平均数差数的平均数=总体平均数的差数.两个样本平均数的差数(2)样本平均数差数的方差=两样本平均数方差之和.样本平均数差数的标准误当σ12和σ22已知H0:μ1=μ2=μ时

当σ12和σ22未知,两样本都为大样本时H0:μ1=μ2=μ时

4、作出推断,并解释之接受H0否定HA或否定H0接受HA或试验设计成组数据平均数的比较成对数据平均数的比较成组数据平均数的比较如果两个样本的各个变量是从各自总体中随机抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立,则不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准,来检验其差异的显著性。根据两样本所属的总体方差是否已知和样本大小不同而采用不同的检验方法。1、两个总体方差σ12和σ22已知,或σ12和σ22未知,但两个样本都是大样本,即n1>30且n2>30时,用u检验法。样本1X1样本2X2总体1σ12总体2σ22例:某杂交黑麦从播种到开花的天数的标准差为6.9dA法:调查400株,平均天数为69.5dB法:调查200株,平均天数为70.3d差异?分析(1)这是两个样本(成组数据)平均数比较的假设检验,σ12=σ22=(6.9d)2,样本为大样本,用u检验。(2)因事先不知A、B两方法得到的天数孰高孰低,用双尾检验。试比较两种调查方法所得黑麦从播种到开花天数有无显著差别。(1)假设(2)水平(3)检验(4)推断H0:μ1=μ2,即认为两种方法所得天数相同。HA:μ1≠μ2选取显著水平α=0.05在0.05显著水平上,接受H0,否定HA;认为两种方法所得黑麦从播种到开花天数没有显著差别。u<1.96,P>0.052、两个总体方差σ12和σ22未知,且两个样本都是小样本,即n1<30且n2<30时,用t检验法。(1)如果σ12=σ22=σ2Se2σ2

平均数差数的标准误H0:μ1=μ2=μdf=(n1-1)+(n2-1)=n1+n2-2例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重(g)高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94分析(1)这是两个样本平均数的检验,σ12和σ22未知,且为小样本,用t检验。(2)事先不知两种饲料饲养大白鼠增重量孰高孰低,用双尾检验。试问两种饲料饲养的大白鼠增重量是否有差别?(1)假设(2)水平(3)检验H0:σ12=σ22=σ2HA:σ12≠σ22选取显著水平α=0.05

(4)推断两样本方差相等。第一步F检验(3)检验(1)假设(2)水平H0:μ1=μ2,即认为两种饲料饲养的大白鼠增重无差异。HA:μ1≠μ2选取显著水平α=0.05第二步t检验(4)推断在0.05显著水平上,接受H0,否定HA;认为两种饲料饲养大白鼠的增重无显著差别,属于随机误差。t0.05(17)=2.110P>0.05df=(n1-1)+(n2-1)=17(2)σ12≠σ22,n1=n2=n

Se2σ2

df=n-1平均数差数的标准误当n1=n2=n时2、两个总体方差σ12和σ22未知,且两个样本都是小样本,即n1<30且n2<30时,用t检验法。例:两个小麦品种千粒重(g)调查结果品种甲:50,47,42,43,39,51,43,38,44,37品种乙:36,38,37,38,36,39,37,35,33,37检验两品种的千粒重有无差异。两样本方差不相等。第一步F检验分析(1)σ12和σ22未知,且不相等,都小样本,且n1=n2,用df=n-1的t检验。(2)事先不知道两个品种千粒重孰高孰低,故而用双尾检验。第二步t检验(1)假设(2)水平(3)检验H0:μ1=μ2,即认为两品种千粒重无显著差异。HA:μ1≠μ2选取显著水平α=0.05(4)推断在0.05显著水平上,否定H0,接受HA;认为两品种千粒重存在明显差异,即品种甲的千粒重显著高于品种乙。t0.05(9)=2.262P<0.05df=n-1=93σ12≠σ22,n1≠n2,采用近似地t检验,即Aspin-Welch检验法。2、两个总体方差σ12和σ22未知,且两个样本都是小样本,即n1<30且n2<30时,用t检验法。检验两品种小麦蛋白质含量是否有显著差异?分析n1≠n2,用近似的t分布,使用双尾检验。测定农大193的蛋白质含量(%)5次,x2=11.7,s22=0.135测定东方红3号的蛋白质含量(%)10次,x1=14.3,s12=1.621(1)假设(2)水平(3)检验H0:σ12=σ22=σ2HA:σ12≠σ22(4)推断两样本方差有显著不同。选取显著水平α=0.05

例:第一步F检验(1)假设(2)水平(3)检验H0:μ1=μ2,即两品种蛋白质含量没有显著差别。HA:μ1≠μ2选取显著水平α=0.01第二步近似t检验(4)推断在0.01显著水平上,否定H0,接受HA;认为两品种蛋白质含量有极显著差异,东方红3号小麦蛋白质含量极显著的高于农大193。t0.01(12)=3.056P<0.01成对数据平均数的比较

将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,以检验处理的效果,所得的观测值称为成对数据。x1x2样本1样本2……n对样本差数的平均数等于样本平均数的差数H0:μd=0df=n-1样本差数的方差样本差数平均数的标准误t值例:在研究饮食中缺乏VE与肝中VA的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和VE缺乏组,然后将试验动物杀死,测定其肝中VA含量,结果如右表:配对正常饲料组VE缺乏组差数dd213550245011001210000220002400-400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000

合计

65007370000试检验两组饲料对试验动物肝中VA含量的作用有无显著差异。分析此题为成对数据,事先不知两组饲料作用孰大孰。盟。(1)假设(2)水平(3)检验H0:μd=0HA:μd≠0α=0.01(4)推断在0.01显著水平上,否定H0,接受HA;两组饲料对动物肝中VA含量作用有极显著差异,正常饲料组的动物肝中的VA含量极显著高于VE缺乏组。t0.01(7)=3.499t>t0.01(7)

已知第三节样本频率的假设检验(略)第五节方差的同质性检验所谓方差的同质性,就是指各个总体的方差是相同的。方差的同质性检验就是要从各样本的方差来推断其总体方差是否相同二、两个样本方差的同质性检验假设两个样本容量分别为n1和n2,方差分别为s12和s22,总体方差分别为σ12和σ22,当检验σ12和σ22是否同质时,可用F检验法。当两样本总体均服从正态分布,且两样本的抽样是随机的和独立的,其F值等与两样本方差s12和s22之比。且否从df1=n1-1,df2=n2-1的F分布。当F<Fα时,接受H0:σ12=σ22,即认为两样本的方差是同质的,当F>Fα时,否定H0:σ12≠σ22,即认为两样本的方差是不同质的。例题检验例4.7中两个小麦品种千粒重的方差是否同质。该题中,s12=22.933,s22=2.933,n1=n2=10(1)假设H0:σ12=σ22,HA:σ12≠σ22(2)水平选取显著水平α=0.05(3)检验(4)推断否定H0,接受HA,即认为两小麦品种千粒重的方差不是同质的习题练习第四节:参数的区间估计与点估计一、参数区间估计与点估计的原理三、两个总体平均数差数的区间估计与点估计二、总体平均数的区间估计与点估计一、参数区间估计与点估计的原理参数的区间估计与点估计是建立在一定理论基础上的一种方法。由中心极限定理和大数定律,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似服从正态分布N(μ,σ2/n)。

00.95(接受区)0.0250.025临界值接受区

0-1.96x

0+1.96xuα:正态分布下置信度P=1-α时的u临界值1-α:置信水平知道x,但不知道μ1-α置信区间、置信距用样本平均数x对总体平均数μ的置信度为P=1-α的区间估计。用样本平均数x对总体平均数μ的置信度为P=1-α的点估计。二、总体平均数μ的区间估计和点估计

当为大样本时,不论总体方差σ2为已知或未知,可以利用样本平均数x和总体方差σ2作出置信度为P=1-α的中体平均数的区间估计为:其置信区间的下限L1和上限L2为总体平均数的点估计L为当样本为小样本且总体方差σ2未知时,σ2需由样本方差s2来估计,于是置信度为P=1-α的总体平均数μ的置信区间可估计为其置信区间的下限L1和上限L2为:总体平均数的点估计L为:

Tа为正态分布下置信度P=1-α时的t临界值例4.14测得某批25个小麦样本的平均蛋白质含量=14.5%,已知σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。分析:本例σ为已知,置信度P=1-α=0.95,u0.05=1.96。蛋白质含量的点估计为:说明小麦蛋白质含量有95%的把握落在13.52%~15.48%的区间里。例题从某渔场收对虾的总体中,随机取20尾对虾,测的平均体长x=120mm,标准差是=15mm,试估计置信度为99%的对虾总体平均数本例中,由于总体方差σ2未知,需用s2估计σ2,当df=20-1=19时,t0.01=2.861。具体计算如下于是对虾体长的区间估计为对虾体长的点估计为:说明对虾体长有99%把握落在110.4mm~129.6mm区间里三、两个总体平均数差数?1-?2的区间估计与点估计

当两个总体方差σ12和σ22为已知,或总体方差σ12和σ22未知但为大样本时,在置信度为P=1-α下,两个总体平均数差数?1-?2的区间估计为:两个总体平均数差数?1-?2的点估计L为其置信区间的下限L1和上限L2为:

当两个样本为小样本,总体方差σ12和σ22未知,当两总体方差相等,即σ12=σ22=σ2时,可由两样本方差s12和s22估计总体方差σ12和σ22,在置信度为P=1-α下,两总体平均数差数?1-?2的区间估计为:两个总体平均数差数?1-?2的点估计L为:其置信区间的下限L1和上限L2为:

当两个样本为小样本,总体方差σ12和σ22未知,且两总体方差不相等,即σ12≠σ22时,可由两样本方差s12和s22对总体方差σ12和σ22的估计而算出的t值,已不是自由度df=n1+n2-2的t分布,而是近似的服从自由度df'的t分布,在置信度为P=1-α下,两总体平均数差数?1-?2的区间估计为:其置信区间的下限L1和上限L2为:两个总体平均数差数?1-?2的点估计L为:上面三式中,tα,df

'为置信度为P=1-α时自由度为df'的t临界值。当两样本为成对资料时,在置信度为P=1-α时,两总体平均数差数?1-?2的置信区间可估计为:其置信区间的下限L1和上限L2为:两个总体平均数差数?1-?2的点估计L为:例题用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重重量(g),两组的数据分别为:高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123低蛋白组:70,118,101,85,107,132,94试进行置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。其置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计为:已算得两种蛋白质饲料饲养的大白鼠增重的差数点估计为:说明两种蛋白饲料饲养下大白鼠增重的差数有95%的把握落在-1.94g~40.284g的区间里。例题试对表4-1资料进行置信度为99%的区间估计和点估计。已算得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论