在临床病例研究中,患者失访是一个较为常见的统计学问题,特别是对随访时间较长的临床研究,患者失随访比率更高。患者失访的原因各异,财政状况,后勤原因,语言障碍,患者个人因素等。失访比例过高可影响最终统计结果的差异。目前有关多少失访比例是合适的统计学研究较少,现普遍认为,失访比例<20%是可以接受的范围,国际上较出名的骨科学杂志,如JBJS,CORR等均将20%作为分界点,若失访比例超过20%,则将患者的研究证据等级从1级调整到2级。尽管如此,目前20%失访比例作为一个临界点仍未得到广泛承认,近日由德国学者完成的一项统计学研究显示,失访比例超过20%可能会对研究结果统计差异性造成影响,相关论文发表于JOT杂志上。
研究者以较早发布的一篇关于工伤补偿是否会显著影响患者功能预后的论文作为研究对象,该论文共纳入637例患者,平均随访时间17.5年,论文中对年龄,性别,损伤严重程度,头部损伤等情况进行了分析,使用Hannover多发创伤预后评分(Hannover Score for Polytrauma Outcome(HASPOC))对最终结果进行统计分析,论文的一个重要结论是:工伤补偿会显著降低受助患者的功能预后水平[odds ratio (OR), 1.8; 95% confidence interval, 1.2–2.6]。
对研究纳入的所有637例患者,以2%,5%,10%,15%(以上按5%递增)等比例采用随机模型删除患者数据建立失访比例模型,直至统计数据出现组别间无显著差异时失访比例模型终止。按失访模型建立后的数据进行相关统计量的分析,重复上述过程50次。此外,为了模拟两种极端情况,建立“最好”和“最差”失访模型。即将患者随访过程中评分按最差至最好次序排列,逐次按比例从最好或最差端开始删除数据建立模型,直至研究组和对照组患者出现统计学无差异。
研究结果显示:在重复50次的随机模型中,统计结果从有显著性差异转变为无差异的失访范围为15%-75%(表1及表2),中位值为40%±18.3。
表1:失访比例为15%时出现统计学结果无差异的随机组
表2:失访比例为75%时出现统计学结果无差异的随机组
当失访比例达到20%以上时,有14/50个模型统计结果开始出现无差异;当这一比例大于30%时,无差异模型的个数为24个,表3,图1.
表3:不同失访比例出现统计学结果无差异的分布
图1:不同失随访比例出现统计学结果无差异的比例分布,X轴失访比例,Y轴统计学结果无显著差异的比例
在2%,5%,10%失随访比例模型中,统计结果无显著变化,即组间比较有显著性差异。
所有建立的随机模型中,OR值在1.56-2.7之间变化。
最好模型中由显著变为不显著的比例为30%;最差模型中该比例为20%。
研究结果显示,即使在一个有较大样本和严格统计分析模型的实验中,失访比例达到或超过20%仍会有相当概率导致结果的偏差,而失访比例<10%时所有结果仍有统计学差异,因此建议20%不能作为失访率可以接受的一个标准,事实上,在病例随访过程中出现的失访数据并不是按随机方式分配的,其存在的差异可能更大;同时研究过程中发现,对所有有统计学差异的模型分析后出现OR值在一个范围内变化(1.56-2.7),这提示我们OR值作为衡量两个统计变化相关性的指标,其值具有高度可变性。建议所有研究者在进行研究设计时重视随访策略的制定,尽可能的获得较多随访数据,若出现随访对象数据丢失,则在讨论中需要详细说明以便广大研究者能自行判断。