分组名称第一章
一、名词解释
1、参数(parameter):也叫参变量,是一个变量。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
2、统计量(statistic):描述样本特征的数,是统计理论中用来对数据进行分析、检验的变量。
3、总体(population):根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。
4、样本 (sample):从总体中随机抽取的部分观察单位,总体中有代表性的一部分。
5、同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。
6、变异 (variation):同质事物个体间的差异。来源于一些未加控制或无法控制的甚至不明原
因的因素。
7、 概率 (probability):度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数。
8、 抽样误差 (sampling error):由于抽样所造成的样本统计量与总体参数的差别。
三、简答题
1、 统计学的基本步骤有哪些?
设计、搜集、整理、分析资料
2、 总体与样本的区别与关系?
区别:
总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。
样本:总体中有代表性的一部分。
联系:总体包含样本,样本是总体中的一部分
3、 抽样误差产生的原因有哪些?可以避免抽样误差吗?
产生原因:
(1)总体单位的标志值的差异程度。 差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。 在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。 抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。 抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
不可以,它具有不可避免性,只能减少抽样误差
4、 何为概率及小概率事件?
概率:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数。
小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将
p(A)≤0.05 或 ≤0.01 称为小概率事件,认为小概率事件在一次试验中不可能发生。
第二章第三章
1. 正态分布 (normal distribution):也叫高斯分布(Gaussian distribution),一种最常见、最重要的连续型对称分布(正态分布是对称分布,但对称分布不一定是正态分布)
2. 中位数 (median):是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。
3. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.即:Q3 --Q1
4. 方差 (variance):样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。反映一组数据的平均离散水平。
5. 正偏态分布 (positively skewed distribution):也称右偏态分布,右侧的组段数多于左侧的组段数,频数向右侧拖尾
6. 负偏态分布 (negatively skewed distribution):左偏态分布,左侧的组段数多于右侧的组段数,频数向左侧拖尾
7. 对数正态分布 (logarithmic normal distribution ):对数为正态分布的任意随机变量的概率分布。如果 X 是正态分布的随机变量,则 exp(X) 为对数分布;同样,如果 Y 是对数正态分布,则 log(Y) 为正态分布。
8. 医学参考值范围 (medical reference range):指绝大多数正常人的解剖、生理、生化、免
疫及组织代谢产物的含量等各种数据的波动范围。最常用的是95%参考值范围。
三、简答题
1. 描述数值变量资料集中趋势的指标有哪些?其适用范围有何异同?
平均数:描述一组变量值的集中位置或平均水平的指标体系。
不同的分布使用不同的指标
(算术)均数:正态或近似正态或观察值相差不大的小样本资料
几何均数:对数正态分布或等比级数资料
中位数 :一般偏态分布(传染病发病的潜伏期)
2. 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?
反映数据的离散度( Dispersion )。即个体观察值的变异(variation)程度。常用的指标有:
1. 极差(Range) (全距) 适用范围:任何计量资料;是参考变异指标
2. 百分位数与四分位数间距 Percentile and Quartile range
百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料
四分位数间距:常用于描述偏态分布资料的离散程度,值越大——变异程度越大,中位数与四分位间距一起使用,描述偏态分布资料的特征。
3. 方差 Variance正态分布资料
4. 标准差Standard Deviation适用范围:均数与标准差经常被同时用来描述正态分布资料的集中和离散趋势。
5. 变异系数 Coefficient of Variation适用范围:主要用于单位不同或均数相差悬殊资料
3. 医学中参考值范围的涵义是什么?确定的步骤和方法是什么?
医学参考值范围 :指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。最常用的是95%参考值范围。
步骤与方法:1). 确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体。
2). 统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同。
3). 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可根据检验判断。
4). 样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知分布时样本含量应更大。
5). 确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。
6). 确定百分位点:一般取95%或99%。
第四章第五章
一、名词解释
1 标准误(standard error):表示样本统计量抽样误差大小的统计指标,统计上通常将统计量(如样本均数、样本率p等)的标准差称为标准误。
2 可信区间(confidence interval):按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidenceinterval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidencelevel),常取95%或99%。
3 假设检验(hypothesis testing):利用样本提供的信息判断假设是否成立的统计方法称为统计假设检验。
4 统计推断(statistical inference):用一个或一系列样本的结果去估计总体可能的结果的过程。包括假设检验和参数估计。
5 Ⅰ型错误(type I error)::“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)
6 Ⅱ型错误(type II error): “实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)
7 检验效能(power of test):当两总体确有差别,按检验水准 所能发现这种差别的能力。
8 变量变换 (variable transformation):也称变量代换,是将原始数据作某种函数转换,如转换为对数值。
三、简答题
1 假设检验的基本原理和步骤。
假设检验过去称显著性检验。它是利用小概率反证法,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。
1. 建立检验假设,确定检验水准(选用单侧或双侧检验)
(1)无效假设(null hypothesis)零假设,记为H0;
(2)备择假设又称对立假设,记为H1。
2. 计算检验统计量
根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。
3. 确定P值,下结论。选定显著性水平α的值,P≤α,拒绝H0,接受H1 ,下“有差别”的结论。P>α不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。
2 标准差和标准误的异同。
相同点:
都是用来表示变异程度的,均是反映随机误差的。
区别:
标准差与标准误的意义、作用和使用范围均不同。标准差(亦称单数标准差) 一般用SD 表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误一般用SE 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差,是量度结果精密度的指标。
标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度;标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等。
3 参考值范围和置信区间有何区别?
参考值范围是指具有明确背景资料的参考人某项指标的测定值,例如医学参考范围指包括绝大多数的正常人的人体形态,功能和代谢产物等,表示值时可能有单侧也可能有双侧,表示方法为正态分布或百分位数法.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论