一、名解:1.总体:根据研究的目的确定的同质观察单位的全体,更确切的说,它是同质的所有观察单位某种观察值的集合。
2、参数:描述总体数量特征的统计指标
3、抽样研究:在医学研究中,为节省人力,物力,财力和时间,一般都采取从总体中抽取样本,根据样本信息推断总体特征的方法,即抽样研究的方法来实现,这种从总体中抽取部分观察单位的过程称为抽样
4.样本含量:从总体中随机抽得的观察单位,其实测值的集合,就称样本,该样本中所包含的观察单位数称为该样本的样本含量
5.变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量
6.计量资料:为观测每个观察单位某项指标的大小,而获得的资料,一般有度量衡单位
7.计数资料:为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料
8.等级资料:又称半定量资料或有序分类变量资料,为将观察单位按某种属性的不同程度分为等级后分组计数,分类汇总各组观察单位数后而得到的资料。
9.误差:泛指实测值与真值之差。按其产生的原因和性质可粗分为随机误差和非随机误差,后者又可分为系统误差与非系统误差。
10.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。在抽样过程中由于抽样的偶然性而出现的抽样误差。随机误差是不可避免的,在大量的重复测量中,或在抽样过程中,它可出现或大或小或正或负,呈一定规律的变化。
11.系统误差:在实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是克制的或可以掌握。
13.几何均数:可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。
15.抽样误差:这种由个体变异产生,随机抽样造成的样本统计量与总体参数的差异。
15.检验效能:1-β称为检验效能,过去称为把握度,其意义为当两总体确有差异,按规定检验水准α所能发现该差异的能力。
16.率:说明某现象发生的频率或强度;率=(某时期内发生某现象的观察单位数/同期可能性某现象的观察单位总数)*比例基数。
17.相对比:简称比,是两个有关指标之比,说明两指标间的比例关系,相对比=甲指标/乙指标*100%。
18.构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。
21.统计量:描述样本数量特征的统计指标。
22.直线相关:是用于判断两个数值变量之间有无直线相关关系,并回答相关的方向和相关程度如何。
23.直线回归:X、Y之间的相关关系呈直线趋势,但与两变量之间的严格的直线函数关系不同,称为直线回归。
24.一型错误:拒绝了实际成立的H0,这类“弃真”错误叫做一型错误.其概率大小用a表示,a可取单尾也可取双尾。
25.二型错误:接受了实际不成立的H0.这类“取伪”的错误叫做二型错误。其概率大小用β表示,β只取单尾,一般未知。
二、简答
一、频数表和频数分布图的用途:
A、描述频数分布的类型(对称分布和偏态分布)B、描述频数分布的特征C、便于发现一些特大的特效的离群值D、便于进一步做统计分析和处理。
二、医学参考值范围的制定注意事项。A、从“正常人”总体中抽样B、控制测量误差C、制定是否需要分组及参考值范围D、取决单、双侧E、选择合适的百分界限F、对资料进行正态检验。
三、假设检验应注意的问题:
A、要有严密的研究设计B、不同类型的资料应选用不同检验方法:根据分析目的、资料类型与分布、设计方案的种类、样本含量的大小C、正确理解“显著性”一词的含义:不能理解为差异大D、结论不能绝对化E、统计“显著性”与医学/临床/生物学“显著性”:统计“显著性”对应于统计结论,而医学/临床/生物学“显著性”对应于专业结论F、可信区间与假设检验的联系与区别:可信区间亦可回答假设检验的问题,算得可信区间若包含H0,按检验水准α,不拒绝H0。若不包含H0,则按检验水准α,拒绝H0,接受H1。
四.应用相对数的注意事项
1.结果相对数不能代替强度相对数、2.相对数要有足够数量3. 要正确计算率,不能简单相加4. 注意资料可比性5.对不不同时期资料,要注意条件是否相同6.样本率的抽样误差不能直接下结论,须进行假设检验
五.POISSON分布的特性:
1.总体均数与总体方差相等2.当n很大,π很小时,且nπ=λ为常数时,二项分布近视poisson分布3.当λ增大时,poisson分布渐近正态分布。当λ≥20时,可以看作正态分布。4. poisson分布的可加性。 对于服从poisson分布的m个随机变量,他们之和也服从poisson分布
六.相关与回归的联系和区别:
1.联系 a,对既可以作相关也可以作回归的分析的数据,计算出b 与r 正负一致。b.相关系数与回归系数的假设检验等价c.同一种数据的相关系数和回归系数可以互算d .用回归解释相关。2.区别 a,资料要求上,相关要求x y服从双变量正太分布。b.应用上,说明两变量相互关系用相关,而说明两变量依存变量的数量关系用回归c. 意义上,r什么具有直线关系的两变量相互关系的方向和程度b表示X每变化一个单位导致y的平均变化量d .计算上不同e,单位上,r没有单位,b有单位。
七、统计表的制表要求:
a、标题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。b、标目:分为横标目和纵标目,来说明表格每行或每列内容或数字的意义,注意表明指标的单位c、线条:至少用三条线,表格的顶线和底线将表格与文章的其他部分分隔开来,纵标目下横线将标目的文字区与表格数字区分开来,竖线和斜线一概省去。d、数字:用阿拉伯数字表示,无数字用“—”表示,缺失数字用“…”表示,数值为零者记为“0”,不留空项,数字按小数位对齐。e、表中数字区不要插入文字。必要说明表标“*”,在表下方以备注的形式说明。
八、非参数检验的优缺点:
非参数检验对总体分布不作严格要求,又称任意分布检验,它直接对总体分布作假设检验,不受总体分布的,使用范围广;其缺点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。适用于:a,不满足正态或(和)方差齐性的小样本资料,b,分布不知正态的小样本资料,c,一端或两端是不确切数值的资料,d,等级资料。
九、t检验的应用条件:
a,单样本的t检验要求资料服从正态分布,b,配对t检验要求差值服从正态分布,c,两样本的t检验要求两组数据都服从正态分布,且方差相等即方差齐性。
十、方差齐性的基本思想和应用条件:1,基本思想:是根据实验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的差异可由某个因素的作用加以解释。通过比较不同变异的来源的均方,借助F分布做出统计推断从而推论各种研究因素对实验结果的影响。2,应用条件:a,各样本是相互的随机样本,均服从正态分布,b,相互比较的各样本的总体方差相等,具有方差齐性。
十一、二项分布的应用条件:
a,每次实验只能发生两种互斥的可能结果之一,且两种互斥结果的概率之和恒等于1,b,每次实验产生某种结果的概率固定不变。C,重复实验是相互的,即任何一次实验结果的出现不会影响其它实验结果的出现。