红枫叶马大姐
我给你的数据起个名字好了,第一列列名叫患病,第二列叫健康,第一行行名叫吸烟,第二行行名叫不吸烟。
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
扩展资料:
理论频数又称验频数,统计学概念,是指用阳性理论率推算各实际频数的估计值 。
双向无序列联表的理论频数Eij等于所在行、列的合计数Oi.、O.j之积除以总频数N
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1 参考资料:百度百科-理论频数
小帅cgnn
T代表每个格子中的理论频数。
计算方法:
卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。
每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
卡方检验要求:
最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据不符合要求,就要应用校正卡方。
利用统计学软件分析结果如下:
data kafang;
input row column number @@;
cards;
1 1 52
1 2 19
2 1 39
2 2 3
;
run;
proc freq;
tables row*column/chisq;
weight number;
run;
扩展资料
一、卡方检验的基本思想
卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。
该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。
如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
二、卡方值的计算与意义
χ2值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。
1、设A代表某个类别的观察频数,E代表基于解析失败 (PNG 转换失败; 请检查是否正确安装了 latex, dvips, gs 和 convert): H_0 计算出的期望频数,A与E之差称为残差。
2、显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。
3、另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
参考资料来源:百度百科-卡方检验
zenghuo721
我给你的数据起个名字好了,第一列列名叫患病,第二列叫健康,第一行行名叫吸烟,第二行行名叫不吸烟。要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
夏可兒雲卿
卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。T为理论数。T计算公式丅RC=nRnc/N,丅RC为第R行C列格子的理论数,nR为第R行的合计数,nC为第C列的合计数。其他:t检验有单样本t检验,配对t检验和两样本t检验。单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。配对t检验:是采用配对设计方法观察以下几种情形:1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。
优质会计资格证问答知识库