中国药物警戒第7卷第3期 2010年3月 March,2010,Vo1.7,No.3 ・药品不良反应信号检测・ 中图分类号:R95;R994.11 文献标识码:A 文章编号:1 672—8629(201 0)03—0142—03 药品不良反应信号检测中混杂因素的控制方法 钱维叶小飞王超贺佳 (第二军医大学卫勤系卫生统计学教研室,上海200433) 摘要:上市后药品不良反应监测无法实现用药人群的随机化,因此无法控制药品不良反应信号检测中数据的混杂 偏倚。通过介绍三种运用较为广泛的混杂因素控制方法,简单分析了各个方法的优缺点和在药品不良反应数据中的 应用情况,以期为上市后药品不良反应的准确监测提供借鉴。 关键词:信号检测;混杂;分层;Logistic回归;倾向性评分法 Methods of Controlling Confounding Factors in Adverse Drug Reaction Signal Detection Qi.m'q Wei YIE Xiao一 ̄ei WANG Chao HE Jia (Department of Health Statistics,FaculW of Health Service,Second Military Medical University,Shanghai 200433,China) Abstract:It is impossible to randomize the allocation of people using the drug under the post—marketing condition, SO hard tO control the confounding bias in signal detection of adverse drug reaction(ADR)databases.This article brielfy introduces three widely—used methods of controlling confounding bisa.It give a brief description of the advantages and limitations of each method,and their applications in ADR signal detection in order tO provide some effective information for the post—marketing surveillance. Keywords:signal detection;confounding;stratification;logistic regression;propensity score 自沙利度胺事件以来,药品安全性问题一直是人们 在分析中忽视潜在混杂因素的影响可能导致完全错误 关注的重点。近年来,人们对药品不良反应(adverse drug 的结论。目前,ADR数据信号检测方法主要侧重药品与 reaction,ADR)的认识逐渐加深,充分意识到动物实验及 ADR的关联,忽略了可能存在的混杂因素,如年龄、性 临床试验的结果均存在相当的局限性,不足以完全预测 别等的影响。使得信号检测结果存在一定程度的缺陷, 药品使用的安全性。对于罕见且严重的不良反应、药品长 其中可能包含了一些由混杂导致的假阳性结果,也可能 期毒性、特殊人群(如儿童、老人及孕妇)的用药安全以及 遗漏了被混杂所掩盖的真实信息。因此迫切需要采用一 药品间相互作用等信息,上市前研究往往是无法涵盖的。 些有效的方法来均衡不同特征数据之间的差异,控制或 因此,上市后药品监测(Post—Marketing Surveillance,PMS) 更为理想地消除混杂因素的作用,使不同特征的数据间 工作的开展显得尤为重要。但药品上市流通后,无法采 更具可比性,从而更好地挖掘出数据问隐藏的信息。准 用严格的试验条件来种种外在因素的干扰,也不能 确的信号检测也可为后期的信号验证节省时间与资源。 象随机对照试验(Randomized Controlled Trial,RCT)那 1混杂因素与混杂偏倚的定义 样,对观察对象进行随机分配,因此难以控制混杂偏倚, 在研究暴露因素和结局事件间的联系时,通常由于 导致ADR数据的分析准确性面临重重挑战。如何正确 一个或多个外界因素的存在,掩盖或夸大了这种联系,从 分析上市后药品不良反应数据,有效控制其中可能存 而部分或全部地歪曲了两者间的真实联系。其中的外界 在的混杂因素的影响,得出相对准确且具有较强说服力 因素被称为混杂因素,所导致的偏倚则称为混杂偏倚。当 的结论,成为上市后药品不良反应监测的重要内容。 混杂因素在所比较的各组问分布不均匀时,就可能导致 正如辛普森悖论(Simpson’S Paradox)中所描述的, 混杂偏倚“]。 在ADR数据信号检测过程中,暴露因素特指所研究 基金项目:国家自然科学基金资助项目(No.30872186),上海市优秀 药品的使用,而结局事件则为不良反应的发生。其中,混 学科带头人计划(A类)(№.09XD1405500) 作者简介:钱维,女,在读硕士研究生,数据挖掘在药物警戒中的应用。 杂因素必须与该不良反应的发生有关,是其危险因子或 ’通讯作者:贺佳,女,博士生导师,药物流行病学及新药评价的统计 保护因子;还必须与所研究的药品相关;但不能是药品 分析。E-mail:hejia@snunu.edu.cn 导致不良反应发生这个过程的中间环节。 142 中国药物警戒第7卷第3期2010年3月 March,2010,Vol 7,No3 2 ADR信号检测中混杂因素的判定 更好的效果。因此,在ADR信号检测方法中运用分层时, 使在控制混杂的同时不致于降低 事实上对于上市后药品ADR信号检测中的混杂因 合适的分层数是关键, 素,尚无确切有效的判定方法,许多相关研究还只是处 灵敏度。于探索阶段,且只是某些特殊情况下的特定结论,不具 3.2 Ix)gistic回归法 备普遍意义上的有效性。目前ADR数据信号检测中混杂 因素的判定基本还是根据经验,相对主观也不够全面。 当ADR数据中存在多个混杂因素以致分层太多, 分层法不能胜任时,可采用Logistic回归模型进行多变量 stic回归在病因学和预后研究中应用非常广 所幸ADR信号检测中有可能存在并且能够被用于 分析。Logi分析的混杂因素并不是很多。有些因素可能确实是混杂 泛,可有效控制混杂偏倚,且方法简便易于实现,在药物 因素,但其相关的描述信息并没有包含在不良反应事件 警戒领域也具有其独特优势I9, 。Logistic回归模型能在 报告表中,如,使用药品时病情的严重情况、临床合并用 药史等,因此无法对其进行分析。一般对于多国的ADR 数据,国籍(或种族)常常可以作为一个混杂因素。类似的 情况是,在多中心临床试验中,常以中心作为分层因素。 其他可能的混杂因素有年龄、性别、季节和地区等。 3 ADR信号检测中混杂因素的控制方法 3.1龠岳龠j晚秀法 分层分析是指将数据按可能的混杂因素分为几层, 使每层的数据之间有较好的同质性,是最常用的检出和 控制混杂偏倚的方法之一。首先将数据按可疑混杂因素 的特征分成若干层,在每一层内分别分析药物与相应 ADR的联系,比较分层前后效应值的差异,判断是否存 在混杂,若存在混杂则进行相应的调整。常用分层的 Mantel—Haenszel法来平衡混杂因素的作用lJ】。 目前,只有多项伽玛泊松分布缩量估计法(Multi—Item Gamma Poisson Shrinker,MGPS)[21在计算经验贝叶斯几 何平均数(Empiircal Bayes Geometirc Mean,EBGM)时使 用分层。AlmenoffJ s吲等曾对MGPS和比例报告比值比 法(Proportional Reporting Ratio,PRR)这两种方法进行了 比较,结果显示,MGPS由于采用了分层分析方法,相对 不容易受到人口统计学资料等混杂因素的影响。当报告 数量较小时,MGPS较PRR更稳定,后者更易检测出假阳 性信号。Woo 等也对疫苗数据作了分层分析,认为达到了 期望的效果。他们对数据分层前后的信号检测结果进行 了比较,分层后许多信号消失了,因此怀疑存在混杂偏 倚;分层后也增加了一些之前未被检出的信号,作者认 为是被混杂偏倚所掩盖的假阴性结果。Woo等还首次实 现了PRR的分层。可见,MGPS方法的优势即可对ADR 数据进行分层分析,从而得出用药人群某些特征与ADR 发生情况之间的关联IS,61。 但分层只能控制少数混杂因素,若增加分层数又可 能导致过度分层,使层内样本量减少,灵敏度降低[7Jq。将 较小的层合并起来或对其赋予较小的权重,可能会获得 复杂关系中平衡多个混杂因素的作用,进一步筛选出主 要的危险因素,并能反映其所占的相对比重。已有相关 ADR信号挖掘的文献表明1“】,当变量极多或需要进行多 重比较时,Bayes与Logistic回归结合的方法更有效。 Hopstadius Es[在其文献中指出,分层分析中,混杂因 素只有在不存在效应修饰的情况下才能被正确评估。当 变量问存在效应修饰时,数据的分层分析破坏了数据的 完整性,通常是不准确的,此时可采用Logistic回归,将 混杂与效应修饰的作用同时纳入模型中进行分析。有学 者认为 】,Logistic回归可用于ADR数据中药物交互作 用的信号检测,但学术界对此仍存在争议[13I。 运用Logistic回归分析需要在分析之前就确定可能 的混杂因素,以便选入模型进行运算,因此分析人员必 须具备一定的专业知识。另外,Logistic回归方法只是对 每个ADR进行定量描述并建立了相应的回归模型,不 能分析各个ADR之间的相互联系,如果存在可能的并发 症,则需采用其他方法作进一步分析。Logistic回归模型 也只能调整可测的变量,如年龄、性别等人口统计学资 料,无法分析健康状况等主观描述的、难以计量的信息 。 3-3倾向性评分法 倾向性评分法(Propensity Score,PS)由Rosenbaum 和Rubin首次提出ll4],其主要作用是能够用具体的公式 来阐述暴露因素与结局事件间假设的因果关系,进一步 估计混杂因素与暴露因素之间的联系程度,从而有效控 制混杂偏倚。近几年来Ps法在药物流行病学中的应用 越来越广泛,是均衡混杂因素的有效方法[15,16】。PS法可 通过判别分析或Logistic回归的方法来估计每个特征变 量的倾向性评分值(即Ps值),高度概括了每个特征变 量的作用,将多个变量的作用综合为Ps值这一个变量; 在计算出Ps值后,可采用变量调整、分层、配比等方法 来平衡各组问特征变量的差异,使各组达到均衡可比, 从而消除了混杂117,1踟。 Ps法能够有效均衡各组间混杂因素的分布和构 143 中国药物警戒第7卷第3期R. 成,并在组间均衡的基础上准确评价药物使用与AD.2010年3月 March,2010,Vo1.7,No 3 状与展望 .药学服务与研究,2009,9(4):255—260. 6】叶小飞,王海南,陈文,等.数据挖掘在药物警戒中的应用【J】.中 间的联系。Ps法也可以减少或避免上述两种方法中可 【能存在的一些问题n ,如分层分析中的分层过小问题和 Logistic回归分析中的共线性问题。Ps法也有其局限性, 其模型中的特征变量应涵盖全部的可疑混杂因素[1S,16,191, 国药物警戒,2008,5(1):36—40. [7]Evans S J.Stratiifcation for spontaneous report databases[J].Drug Saf,2008;31(11):1049—1052. [81 Hopstadius J,Nor 6 n G N,Bate A,et a1.Impact of stratiifcation in adversedrug reaction surveillnce[aJ].DrugSaf,2008,31(11):1035— 1048. 这一点与Logistic回归是相似的;但若在其中添加了过 多的不相关的变量,又可能增加噪音和变异,因此需要 事先明确可疑混杂因素。Ps法中将所有混杂因素结合 为一个变量,因此不能区分具体某个混杂的效应,只能 [91 Hauben M,Madigan D,Gerrits C M,et a1.The role ofdata mining in pharmacovigilance[J].Expert Opinion Drug Safe,2005,4(5): 估计其总体影响。对于Ps法预测模型的建立,最佳配比 的实现等问题,还有待进一步探讨。 4结语 上述每种方法都有其相对应的适用条件,因此在 ADR信号检测中,应根据数据特征和实际研究目的来 选择合适的混杂控制方法。基于ADR数据的特殊性,目 前对于ADR数据中混杂因素的控制 还处于试验探索、 求证阶段,迫切需要形成系统的理论。国外已有相关研 究致力于将传统混杂控制方法与新兴的数据挖掘方法 结合起来,这也为我们下一步的研究提供了思路。 另外,如果能在不良反应数据中增加额外的有效信 息 201,如健康状况、饮食习惯、合并用药史等,不仅可以 搜集到尽可能多的可疑混杂因素,在运算中对其进行分 析以避免信号检测结果出现偏倚;还可以分析药物与这 些因素间是否存在效应修饰作用,即交互作用,包括药 物与食物的相互作用、某些慢性病长期用药对新近用药 的影响等;添加这些信息还有助于对生成的信号作出评 判,或进一步进行流行病学研究,确定药物与不良反应 问是否存在因果联系,从而更有效地监测药品不良反应。 参考文献: [1】沈福民主编.流行病学原理与方法[MI.1版.上海:复旦大学出 版社,上海医科大学出版社,2001:148—155. [21 Hauben M,Bate A.Decision suppoa methods for the detection of adverse events in post—markedng data[J].Drug Discovery Today, 2009,14:343-357. [3】Almenoff J S,LaCroix K K,Yuen N A,et a1.Comparative Perfor- malice ofTwo Quantimfive Safety Signalling Methods:Implications ofr Use in a Pharmacovigilance Department[J].Drug Saf,2006,29 (1O):875-887. [41 Woo E J,Bali R.Burwen D R,et a1.Effects of stratiifcation on data mining in the US Vaccine Adverse Event Reporting System (VAERS)[J].Drug Saf,2008,31(8):667—674. [5]罗宝章,钱轶峰,叶小飞,等.药物不良反应信号检测方法的现 144 929-948. [1O]A1menoff J S,Pattishall E N,Gibbs T G,et a1.Novel stmisitcal tools ofr monitoring the safety of marketed drugs【J】.ClinPharmacol hTer,2007,82(2):157—166. [111GenkinA.LewisDD&MadiganD.BBR:BayesinaLogisticRe— gression Software[EB/OL].[2009—12-20].http://www.stat.mtgers. edu/Bmadigan/BBR/(accessed 23 April 2007). [121 van Pu ̄enbreok E P,Egbe ̄s A C,Heerdink E R,et a1.Detceting drug—dmg interactions using a database for spontaneous adverse drug reactions:an example wiht diuretics and non—-steroidal anti—- inflmamatory drugs[J].European Joumal of Clinical Pharmacolo— gY,2000,56:733—738. [131 Noren G N,Sundberg R,Bate A,et a1.A statistical methodology ofr drug drug interaction surveillnace[J].Stat Med,2008,27:3057- 3070. [14】Paul R,Rubin D B.Reducing bisa in observational studies using subclassiifcation on the propensity score【J】.J Am Stat Assoc,1984, 79:516-524. 【l5】赵守军,张勇,汪萱怡,等.均衡组间差异的有效方法:倾向评分 【J].中华流行病学杂志,2003,24(6):516—519. [161沈剑文,张亮,王大猷.倾向分析法在药物流行病学研究中的应 用[JJ.药物流行病学杂志,2008,l7(2):121—125. [171 Joffe M M,Rosenbaum P R.Invitde commentary:propensity scores[J].Am J Epidemiol,1999,150:327—333. 【l8]Hanley J A,Dendukuri N.Efifcient sampling approaches to ad— dress confounding in database studies【J】.Staitstical Methods in Medical Research,2009,18:81-105. [19]Rosenbaum P R,Rubin D B.Reducing bisa in observational smd— ies using subclsasification on hte propensity score叨.Am Stat Assoc, 1984.79(387):516-524. 【20】Groenwold RHH,Hoes A W,Nichol K L,et a1.Quantifying the potentila role of unmeasured confounders:the example of influenza vaccination[J】.Intemational Journal of Epidemiology,2008,37: 1422-1429. (收稿日期:2010—01—08编辑:范燕)