目前,随机对照临床试验 (RCT) 是评价临床疗效最具价值的方法,但很多有关脊柱外科手术疗效的 RCTs 研究结果不一致。近来引入的脆值(Fragility Index),作为 p 值和 95% 可信区间的补充,是用来评估 RCTs 研究结果可靠性的新型指标。
脆值指在一个研究中,如要改变某「事件」统计学意义(如从无统计学意义变为有统计学意义,所谓「事件」包括任何具有两元结果的项目-融合成功率、意外骨折、邻近节段是否退变及某一评分是否合格等)所需的最少患者的数量,脆值小表明研究结果的统计学意义取决于少数「事件」,而脆值大意味着观察到的治疗效果信度的提高。
加拿大安大略省麦克马斯特大学附属医院骨科的 Evaniew 教授等人进行了一项荟萃分析,提示脆值为脊柱手术随机对照试验研究之新考量标准,文章发表在近期的 Spine J 上。
该研究系统筛选了 2009 年到 2014 年,循证骨科系统数据库中所有脊柱手术治疗、包括至少一个阳性结果项目的 RCTs ,两位独立的评审人评估 RCTs 是否可纳入研究并提取相关数据,应用 Fisher 精确检验法检测脆值,应用多因素回归分析评估相关因素。
图 1. 40 项 RCTs 的脆值
结果提示,40 项符合 RCTs 符合纳入标准,这些研究中所纳入患者的中位数为 132,四分位间数为 79–208,所纳入研究的「事件」项目的中位数为 31。总体脆值的中位数为 2,即任何一个 RCTs 中加入两个「事件」项目,便可消除统计学意义。脆值 ≥ 3 的 RCTs 占了 75%,少于或等于 65% 的试验中失访患者数量。
脆值数值与总体样本量大小正相关;以失访和偏移风险修正,脆值的增加仅与报道的显著性增高(p<0.01)相关。
综上,脊柱手术的 RCTs 统计显著性结果比较脆弱,少许疗效事件的增加即可完全消除统计学意义。本研究首次阐明了脊柱手术随机对照临床试验研究的脆值;脊柱手术干预的随机临床对照试验研究,零假设常为所研究的手术干预方法间无差别。我们脊柱外科医师应明确,随机临床对照试验,脆值高,结论更具可信度;样本量(参与者人数)和观察的事件数量均有意义。
脆值,无疑为我们脊柱外科医师、研究者将来开展临床试验研究,提供了又一有力参考工具。