医学观察性研究设计讲座(连载五)
专题讲座
13
现代养生 2020年12月第20卷第22、24期医学观察性研究设计讲座(连载五)
徐应军
4.4.2 设计内容与实施步骤
4.4.2.1选题 队列研究的成本高、难度大,一般只用来验证病因假设,而非探索,因此选题的假设必须确切,通常是经过了现况研究和病例对照研究反复论证确定的。选题的同时,暴露因素和结局事件也随之被确定。
4.4.2.2 研究因素的设计 研究因素包括暴露因素和影响因素两大类。加班费怎么算
(1)暴露因素设计:暴露因素是研究假设中的“因”,是最终需要作出解释的变量,即自变量。暴露因素设计内容包括:因素定义及测量方法。定义尽量采用标准的、公认的,或文献经常使用的;测量方法应该灵敏、简便、客观和量化。暴露的测量还要注意暴露的开始时间、持续时间、暴露方式(直接与间接、连续与间断、长期与偶尔)等。
(2)影响因素设计:影响因素指暴露因素以外的因素,如人口学因素等,设计目的是估计各暴露组的可比性、调整混杂因素的影响、参与结果的深入分析等,设计时也应该包括定义和测量方法。
4.4.2.3 研究结局事件设计 结局事件是研究假设中的“果”,是队列随访期望得到的结果变量,即因变量,也称为结局。结局的设计内容包括:结局的定义、测量方法、评价标准。结局可以是某个事件的最终结果,例如发病、死亡等,也可以是中间的某个发展阶段,例如脑梗死研究中的短暂性脑缺血发作,心肌梗死研究中的心绞痛、冠状动脉狭窄程度等。因此结局的定义应当有准确的名称、诊断的程序和确诊的标准。队列研究可同时观察多种结局与暴露的关系,设计时列入随访的疾病种类越多,研究的效率越高。4.4.2.4 建立队列 队列至少包括暴露和非暴露两个组。
(1)暴露组:暴露组由具有所研究的暴露因素的个体组成,研究中可以只设1个暴露组,也可以按照暴露的水平设几个亚组。根据研究的目的暴露组有以下来源。
1)一般人:如果所研究的暴露和疾病是常见的,而非某个特殊人固有的,或者研究的目的是指导该病在一般人中的防治时,最好从一般人中选择暴露组,即从一般人中暴露于所研究的因素的个体中选择暴露组。
2)职业人:如果所研究的暴露是某个职业因素,或暴露因素在某个职业相对比较集中,如煤矿工人的粉尘暴露、炼钢工人的高温暴露等,需要在职业人中选择暴露组。
3)特殊暴露人:如果所研究的暴露因素与某些特殊的经历、自然环境、社会因素等密切相关,研究这些暴露与疾病的关系时,需要在特殊暴露人中选择暴露组,例如在地震灾区研究灾害对人心理健康的远期影响等。
4)社会团体人:某些有组织的社会团体成员,如学会会员、学校学生或教师等,具有系统的组织性和相同的职业及经历,便于队列研究的资料收集、随访观察和外部因素的控制。
(2)非暴露组:非暴露组是队列研究的对照组,因此要求与暴露组具有良好的可比性,即除了对所研究的因素暴露状态不同以外,其他因素尽可能地与暴露组一致或接近。非暴露组的设计类型有:
1)内对照(internal control):在选择暴露组的人内,选择未暴露的个体组成的对照组为内对照。内对照与暴露组是同一个人的两个部分,因此对照的选择比较方便,而且外部因素相对一致,可比性较好。有时一个人内很难区分完全未暴露者,如工厂的有害气体,厂区的所有人都可能暴露,但不同工种暴露的程度差别很大,这时可以将暴露水平最低的工种作为对照组。
2)外对照(external control):如果产生暴露组的人确实无对照组可选,则需要从其他人中选对照,这种对照为外对照。外对照与暴露组并非来自同一个人,外界因素差别较大。因此,外对照的选择需要考量与暴露组的可比性问题。
3)总人对照:是以暴露组所在的地区全人为对照,这种设计不需要专门技术选对照组,
作者单位:063210河北省唐山市,华北理工大学
专题讲座
Health Protection and Promotion December 2020 Vol.20 No.22,24
14也不需要调查对照组的每个个体进,而是直接利用该地区人口有关疾病或死亡的现成统计资料。因此,这种对照设计简单、资料收集容易,但资料不够精细,可控制和分析的因素有限,研究结果比较
粗糙。由于对照中含有暴露人的信息,因此该对照仅适用于人暴露率很低的因素的研究。
4.4.2.5 样本量估计 除了显著性检验水平α和把握度(1-β)外,影响队列研究样本量的因素主要有对照人所研究疾病的发病率P 0和暴露组与对照组该病发病率之差d 0通常P 0越接近50%,或d 值越小,所需样本量越大。队列研究样本量的计算公式:
(公式1)
式中n 是暴露组的样本量,对照组等于n ,z α、z β是常数,可由标准正态分布界值表查得,对照人发病率P 0可以根据文献估计,其他指标计算公式如下:
(公式2)式中RR 是某因素的相对危险度,需要根据文献估计。
4.4.2.6 基线资料收集 队列建立后,需要对每个研究对象进行调查,详细收集研究开始时的相关资料,这些资料称为基线资料,这次调查称为基线调查。设计时要明确基线调查的内容和方法。基线资料包括暴露因素、影响因素和健康状况,是暴露分组和结果分析的重要依据。将所要调查的内容制定成问卷调查表,依据问卷开始调查。调查方式包括问卷访谈、查阅档案、体格检查、实验室检测、环境测试等。
4.4.2.7 随访 完成基线调查后,队列开始随访,是队列研究中最为艰难和重要的一项内容,随访的质
量直接关系到研究的成败,因此必须提前周密设计,按照计划严格实施。设计的主要内容如下:
(1)随访期限:根据潜伏期(或潜隐期),确定随访的期限。暴露因素的潜伏期以文献报道为依据,类似肿瘤等慢性疾病的潜隐期较长,通常认为10至15年。在设计时要考虑到许多暴露
在建立队列时已经存在,因此随访期限不一定要满足1个潜伏期,可以适当缩短,减少随访时间延长带来的诸多不便。
(2)随访内容:重点是结局,要详细记录结局发生的时间、诊断的依据、诊断机构及诊断者的资质等内容。随访过程中要密切注意每个人暴露状况及其他特征的变化情况,随时记录变化的时间及变化的内容,如吸烟者的吸烟量、种类、方式有无变化,是否戒烟等;非暴露者是否开始暴露,暴露的开始时间、暴露的剂量、方式等。
(3)随访方式:对暴露因素及其他特征因素可以通过面对面、电话、信函等访谈的形式随访,对结局及其他疾病需要体检诊断,对环境因素需要现场检测和实验室分析。
(4)随访间隔:对于随访期较短的研究,可以在研究结束时一次性完成随访任务,而对随访
期较长的研究,每1~2年随访1次。随访间隔太长,不易及时发现失访者,信息损失较大。4.5 资料整理与分析4.5.1 资料整理
4.5.1.1 建立数据文件 队列研究的资料包括基线资料和随访资料。在基线调查后及时将核实无误的数据录入计算机,建立数据文件。随访资料需要独立录入建立平行数据文件,并与基线资料数据文件进行对比,将有变化的数据补充到基线数
据文件。为了保证随访资料准确地与基线资料对应接轨,研究对象的统一编号至关重要,并在全部研究过程中保持编号的唯一性。4.5.1.2 资料描述
利用基线数据文件描述队列的人口学特征、平均随访时间、失访情况等;对暴露组与对照组重要特征构成进行比较,分析两组的可比性;基线资料与随访资料比较,描述重要特征变化情况及规律。4.5.2 数据分析
4.5.2.1 分析表格 队列研究资料有两种分析形式,即累计发病资料和发病密度资料,两种资料分析表格的基本形式见表1和表2。
表1 队列研究累计发病率分析基本表格形式组别发病人数未发病人数
合计累计发病率暴露组a b a+b a/(a+b)对照组c d c+d c/(c+d)合计
a+c
b+d
n
(a+c)/n暑假旅游
表2 队列研究发病密度分析基本表格形式组别发病人数人时数发病密度
暴露组a N1a/ N1
对照组b N0b/ N0
合计a+b N(a+b)/N六级写作模板
4.5.2.2 人时计算
在队列研究中由于队列成员进入队列的时间不完全一致,或因为失访、过早死亡、出现结局、中途退出等原因,使队列成员之间实际的观察期限不同。显然,在这种情况下,仅仅利用队列开始的成员数或终止时的成员数做分母计算发病率都是不合理的。一种处理方法是引入时间因素,即将每个成员在队列中实际观察的时间作为对研究的贡献,如某人观察了10年,那么他就贡献了10个人年,另一人观察了6年,就贡献了6个人年,两个人共计观察了16个人年。以队列中总的观察人年数为分母计算发病率,可以得到人时为单位的发病率,能够较好的处理起始队列与终止队列人数不等的问题。人时单位
最常用的为人年、人月。人时计算是队列研究中极为复杂的工作,好在目前有专用计算机软件帮助计算,这里介绍几种人工计算方法,以加深对人时单位的理解。
(1)以个人为单位计算:将队列中每个成员逐一计算,最后求队列总观察人时数的方法。这种方法虽然繁琐,但比较精确,同时可以获得各年龄段的观察人时数,便于计算年龄别的人时发病率。
例如甲、乙2人,甲2000年1月1日进入队列,当时23岁,2007年6月30日失访;乙2000年6月30日进入队列,当时28岁,观察到2010年1月1日。2人的人年计算见表3,可见共计观察了17人年。
表3 甲、乙2人观察人年计算
人员
年龄段(岁)
合计(人年)
20-25-30-35-
甲  2.0  5.00.57.5
乙  1.5  5.0  3.09.5
合计(人年)  2.0  6.5  5.5  3.017.0(2)以体为单位计算:如果对人年计算要求不是太精确,或队列成员进入和退出的时间不是很清楚,可以采用各随访期的平均人数乘以观察年数的方法计算,平均人数为相邻两次随访人数的平均值。例如2006建立队列,2008年随访一次,2010年终止,总观察期限为4年,该队列观察人年计算见表4。因为每次随访观察期为2年,所以各随访期观察的人年数是各随访时的平均人数×2,总的随访人年数是2次随访观察人年数之和。
表4 某队列观察人年计算
年龄(岁)2006年队列人数
2008年随访2010年终止队列
观察人年数队列人数平均人数人年数队列人数平均人数人年数
35-98369857984719694984098491969839392 45-1259312578125862517212562125702514050312 55-76257643763415268762176321526431132合计30054300783006760134300233005160102120836
4.5.2.3 分析指标的计算及统计学检验
(1)累计发病率(cumulative incidence):当队列比较稳定,以起始人数为分母,以所观察到的全部病例为分子计算的发病率为累计发病率。当所得率不是太小,可以用四格表 检验,判断暴露组与对照组发病率差异是否具有统计学意义。
(2)发病密度(incidence density):以队列成员观察的总人时数为分母,以队列中观察到的全部病例为分子计算的人时单位发病率,为发病密度,用于队列研究中各成员观察期限相差较大时的资料分析。例如一项煤矿工人粉尘暴露与肺癌关系的随访资料见表5。
表5 煤矿工人粉尘暴露与肺癌关系的队列研究结果更改ip
组别肺癌人数观察人年数
发病密度(1/10万
人年)
暴露组41(a)214300(L1)19.13(a/ L1)
对照组9(b)331200(L0)  2.71(b/ L0)
合计50(a+b)545500(L)9.17((a+b)/L)
其中:
暴露组的发病密度ID1=(a/ L1)=41/214300=19.13(/10万人年);
对照组的发病密度ID0=(b/L0)=9/331200=2.71(/10万人年)。
发病密度组间比较的显著性检验的公式为:
15
现代养生 2020年12月第20卷第22、24期
关系的人随访资料见表8,结果显示随舒张压水平的增加,脑卒中的相对危险度增大,经过线性趋势χ2检验,具有统计学意义(χ2=28.34,P <0.001)说明存在剂量反应关系。
表8 40~49岁男性舒张压水平与
脑卒中关系的10年随访结果
舒张压水平(mmHg)观察人年
病例数
发病密度(1/10
万人年)
RR
<8032680618.36  1.00
80-367001827.25  1.48
90-276702383.12  4.53
100-1459021143.937.84
合计1116406860.91
4.6 注意事项
4.6.1 研究目的要明确,假设要准确
病因学研究的思路是由浅入深,先易后难,研究的内容顺序是:形成假设→检验假设→验证假设;研究方法的顺序是:现况研究→病例对照研究→队列研究→实验性研究,因此选择何种方法做研究,依据是对该问题的研究进行到哪种状态。队列研究是一项耗时、费力的高投入性研究方法,因此在选择队列研究前,必须要有充分的前期基础性工作和大量文献证据,确保研究能够达到预期目的,避免造成不必要的浪费。
4.6.2 研究的疾病发病率不能太低
如果所研究的疾病在队列人中的发病率较低,随访结束后没有病例产生,显然研究失败;如果有病例出现,但数量很少,达不到统计学分析的基本要求,也不能得出研究的结论。因此,所研究的疾病的发病率或死亡率较高时,才能得到足够的病例数进行分析,达到预期研究目的。
4.6.3 选择人口相对稳定,数量足够的人建立队列
队列研究需要长时间的随访观察,在人口数量较大、人口流动性较小的相对稳定的人建立队列,可以获得足够的符合研究条件的样本,包括暴露组与对照组,可以保证随访结束时大多数队列成员能够追踪随访到。
4.6.4 队列成员的入选条件
先“因”后“果”和随访是队列研究的两个重要特点,为了确保因在先,起始队列中必须剔除已经出现结局或不可能再出现结局(如传染病后的免疫人口等),以及随访后不久(达不到设计潜伏期要求)出现结局的个体;同时对于因各种原因不能坚持随访的个体亦应剔除。
4.6.5 偏倚控制
队列研究中同样存在选择性偏倚、信息偏倚和混杂偏倚,但最具有特殊性的是失访偏倚。如果失访在暴露组和对照组之间分布不均,或失访者的发病率与未失访者不同,会使暴露与疾病之间关系的研究结果偏离于实际情况,这种现象为失访偏倚。失访偏倚类似现况研究中的无应答偏倚,属于选择性偏倚。常见的失访原因有①拒绝随访:有些成员因为对研究不敢兴趣或反复参加随访比较麻烦而拒绝继续随访;②迁移外地:因为工作调动或生活等原因移居外地失去联系;③其他原因死亡,即随访期间死于非研究疾病,如意外伤害、其他疾病等,使研究者不能判断将来是否会发生结局。
失访在队列研究中很难避免,尤其是规模大、时间长的队列研究,失访就更容易出现。失访对研究结果的影响与失访率的高低和失访者特征有关。一般认为当失访率小于5%时,结果可以接受。如果失访率大于5%,要分析失访是否具有偏性,例如①暴露组与对照组失访率是否接近,如果接近偏倚会相对较小;②比较失访者与未失访者基线资料,如果某些重要特征比较接近,失访可能是随机的,对结果影响较小。否则失访对结果的影响不能忽视,必须采取补救措施。具体措施有:4.6.5.1 预防失访的措施
(1)选择在人口稳定,交通、通讯比较发达的地区建立队列。
(2)通过地方管理机构,做好人的组织和宣传工作,最大程度上获取当地管理人员和队列成员的信任与合作。ipad分屏怎么用
(3)随访方法简便易行,既能使参与者从中受益,又不会带来麻烦与干扰。
(4)每个成员建立多种,包括单位、社区、亲友等。
4.6.
5.2 失访的补救措施
(1)多渠道获得失访者的信息,如医院、保险、单位、社区、亲友等,弥补有关失访后资料的缺失及不全。
(2)多方式获得失访者的合作,如通过单位、社区组织健康教育、知识宣传、健康查体等活动,提高参与者的兴趣和热情。
(3)多途径获得失访者的下落,如通过失访者的工作单位,或居委会、亲友,取得失访者的去向和,如有可能与失访者建立新的联系,全力收集相关资料和数据。
国产悬疑电视剧
(未完待续)
17
现代养生 2020年12月第20卷第22、24期

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。