样本量估算需要考虑哪些因素——系列之三
样本量估算需要考虑哪些因素——系列之三
小白学统计
stats_for_dummy
功能介绍 以通俗易懂的语言介绍并推广统计学,让即使完全不懂统计的小白也能够看懂。
2018-04-26
收录于话题
样本量估算需要考虑的第三个重要因素:
三、研究假设
研究假设是针对特定总体提出的、与主要研究目的有关的一种假定。通常我们在做某一研究时,都要先提出一种假设,然后招募研究对象,获取数据并进行统计分析,根据统计分析结果判断事先做出的假设能否成立。
1. 无效假设与备择假设
最基本的两种假设是无效假设(null hypothesis)和备择假设(alternativehypothesis),这是统计检验的基础,在理解下面的几种假设之前,我们有必要先回顾一下这两种最基本的假
设。
统计分析的过程可以看作是一个验证假说的过程,当你开始一项研究的时候,总会有一个事先的假定(否则你就不会做研究了)。比如研究感染幽门螺杆菌是否会增加胃癌发生的风险,你可能会事先有个假定,根据以前的临床观察,认为幽门螺杆菌感染的患者可能发生胃癌的风险会增加,这就是你打算验证的假设。
不过假设检验并不是直接验证你这个预期假定,而是通过无效假设先做出一个“无效”的假定,即认为幽门螺杆菌感染并不增加胃癌发生的风险(或者说,幽门螺杆菌阳性患者的胃癌发生率并不比阴性患者高)。然后利用收集到的数据计算统计结果,检验这一结果能否推翻无效假设。
有的统计学家也将这一过程称为“攻击稻草人”的过程,它是通过反证法的思想,设定无效假设,然后计算在无效假设成立的条件下,出现现有数据所得结果的概率有多大。如果出现的概率很低(如<0.05),可以认为,如果无效假设成立,出现现有结果的概率很低,换句话说,这种结果不大可能出现,一旦出现,很有可能是无效假设本身有问题。所以认为无效假设可能是错误的,不能接受无效假设,而应接受无效假设的对立面,即备择假设。
无效假设和备择假设始终是相互对立的,通常备择假设是你预期想要达到的结论,而无效假设只是你想攻击并推翻的对象。例如:
无效假设:幽门螺杆菌阳性不会增加胃癌发生的风险;
备择假设:幽门螺杆菌感染会增加胃癌发生的风险。
无效假设:服用塞来昔布与不服用塞来昔布对关节炎患者具有相同的疗效;
备择假设:服用塞来昔布的关节炎患者其疗效不等于不服用塞来昔布的关节炎患者。
2. 单侧假设与双侧假设
有一个问题很令临床人员头疼,那就是到底什么时候选择单侧假设,什么时候选择双侧假设?如果你的备择假设很明确地规定了关联方向(如幽门螺杆菌感染会增加胃癌发生的风险),这就是单侧假设;如果备择假设不确定关联方向(如幽门螺杆菌感染与胃癌发生有关,可能是降低也可能是增加),这就是双侧假设。
备择假设既可以是单侧的,也可以是双侧的,取决于你的研究目的。有些情况下,你可能
已经很确信你的研究只可能出现单方向的关联,那就可以考虑单侧假设。例如阳物与安慰剂对比,你完全有把握认为阳的疗效不可能低于安慰剂,此时备择假设就可以是阳疗效高于安慰剂。但是有一点必须提醒一下,有时即使你认为不可能出现双侧关联,结果往往仍会出乎你的意料。如国外一项关于胡萝卜素会降低肺癌发病风险的研究,就出现了与单侧假设不符的结果。所以比较稳妥的建议就是,尽量采用双侧检验。
采用双侧检验和单侧检验所需的样本量是不一样的,因为单侧检验水准和双侧检验水准所对应的标准正态分位数不同。单侧检验对应的是Z1-α,而双侧检验对应的是Z1-α/2,因此,在其它参数相等的情况下,双侧检验计算的样本量会多于单侧检验。但是一定要注意,千万不要因为这个原因去使用单侧检验。使用单侧或双侧检验是事先定好的,而不是事后分析发现双侧检验P=0.072而单侧检验P=0.036而改成单侧检验。
临床试验中会对单侧检验和双侧检验分的比较清楚。常见的差异性检验都是基于双侧假设,而非劣效性检验、优效性检验、等效性检验则是基于单侧假设。
非劣效性(non-inferiority)试验是检验试验药是否不劣于对照药的试验。非劣效性试验通常只用于阳物对照的试验中。采用非劣效试验时,阳物应为具有明确疗效的上市
药物,试验药应在其它方面对阳物具有一定优势,如不良反应低、给药方便、耐受性好、价格便宜等。
等效性(equivalence)试验是检验试验药与对照药是否等效。等效性试验通常用于阳性对照药的试验,如某仿制药与原药进行疗效比较,如果达到等效性,则仿制药可被接受。再如,研究能否以小剂量代替大剂量,以疗程短的药物代替疗程长的药物等,均可采用等效性试验。
优效性(superiority)试验是研究一种药物的疗效是否优于另一种药物(或安慰剂)。通常情况下,以安慰剂为对照的试验应当做优效性检验。
以均值为例,假定T表示试验组,C表示对照组,表1说明了这几种检验的假设。
临床试验中常见检验类型及假设
检验类型
无效假设
备择假设
差异性检验
H0μT-μC=0
H1μT-μC≠0
非劣效性检验
H0μT-μC≤-δ
H1μT-μC-δ
等效性检验
H0|μT-μC|≥δ
H1|μT-μC|δ
优效性检验
H0μT-μ设置特殊意义的号Cδ
H1μT-μCδ
注:μTμC分别表示试验组和对照组的总体均值,δ表示非劣效界值。
对于非劣效检验、优效性检验和等效性检验,在样本量计算时,除了需要考虑单侧检验水准之外,还需要确定非劣效界值、优效性界值和等效性界值。这些界值通常可根据临床实际情况来确定,对于临床难以确定的界值,可结合临床和统计学综合考虑,具体可参考《医学实验设计分析与SAS实现》。
3. 事前假设与事后假设
事前假设是在研究开始前就明确在方案中规定好的假设,是研究者目的很明确的要做的假设。比如你要做一项随机对照试验,验证孟鲁司特钠(Montelukast)与安慰剂对比成人感染后咳嗽的效果,该研究是一个优效性研究,那事前就会做出备择假设为:孟鲁司特钠咳嗽的效果优于安慰剂。
事后(post-hoc)假设是指在根据事先计划对数据进行统计分析结束后,进一步做的一些探索性分析,事后假设一般没有出现在研究方案中。例如,分析清除幽门螺杆菌对胃癌影响的研究中,研究者根据数据,发现吸烟人和不吸烟人的效果不同,因此想探索一下
在吸烟人这一亚组中,清除幽门螺杆菌的效果如何。这一假设在一开始的方案中并没有规定,而是统计分析后根据分析结果的提示而产生的想法,这就是事后假设。
事后假设由于是根据已有的一定结果提示而产生的,而且往往是针对某一亚组人,因此容易产生假阳性错误。所以对事后假设通常需要对检验水准进行校正。很多情况下,如果你想做事后假设,可能会出现样本量不足的情况。所以在计算样本量的时候,尽量在事前假设中考虑好你想要实现的目的。
4. 单一假设与多重假设
单一假设也就是只做一次假设检验,如两种药物的疗效比较,备择假设就是两组间差异不相等。这种假设中,研究终点一次比较,不涉及多组两两比较,而且只有一个主要疗效指标。所以在做假设检验的时候,只需一次即可。
多重假设即对同一数据多次使用假设检验,由于统计学假设检验总是存在一定犯错风险,因此多次假设检验存在的错误风险更大。这时在计算样本含量的时候,必须考虑到这种由于一类错误扩大所带来的样本量增加问题。当涉及到多个主要疗效指标、多组间两两比较、多次时间点比较等情形,就会遇到多重假设问题。
1)多个主要疗效指标的情况
如果要求多个主要疗效指标同时有统计学意义,才算有统计学意义,此时无需校正α
如果只要一个指标有统计学意义,就认为有统计学意义,这时需要校正α。通常可按指标的重要性对α分配,重要指标的检验水准大一些,次要指标检验水准小一些;如果难以取舍,则将α等分。不管如何分配,其总和不超过α
还有一种情形称之为顺序检验(hierarchical testing),是指对于多个分析指标,事先设定一定的分析顺序,然后根据这一顺序,依次检验。只有第一个指标有统计学意义,才继续分析第二个指标,第二个指标有统计学意义,才继续分析第三个指标,……,以此类推。例如有abc三个主要疗效指标,研究设计时便设定其分析顺序为abc,则在进行统计分析时,首先分析a,如果a有统计学意义,则分析b,否则整个分析结束。如果继续分析,如果b仍有统计学意义,则分析c,否则分析结束。这种情况下,无需对检验水准校正。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。