注册 通行证| 用户名 密码 加入收藏 | 设为首页 [进入论坛]
您当前所在位置:长江网   >   论文   >   医学论文   >   医学论文  >  正文
临床试验中平均处理效应的上下界
来源:网络 发布日期:2010-09-14

摘要:在随机处理─对照的临床试验中,经常出现不依从或部分依从的现象,此时,由于所涉及到的“虚拟事实”变量,即不能观察到的潜在变量太多而不易估计其平均因果效应ACE. 在仅出现完全依从和不依从情况时, Balke and Pearl 利用线性规划的方法获得了ACE 估计量的上下界,利用他们所提供的方法,有时会出现下界为负数,显然,这样的下界没什么实际意义. 根据Angrist , Imbebns & Rubin 讨论工具变量时所提出一些假设条件,导出了在不同情况下,计算ACE 估计量的上下界的方法,并证明了其下界一定是非负的,所得到的上下界区间比Balke and Pearl 的区间要小. 同时,还讨论了部分依从情况下,ACE 估计量的上下界的计算方法,并得到了相应的结果.


1  引言
在医学试验中,为了评价一种药品的效果,通常将受试者随机地分成处理组和对照组. 分在处理组中的人服用指定药品,而分在对照组中的人仅服用安慰剂. 经过一定时间后,观察两组的结果,用统计分析的方法对该药品的因果效应进行推断,以判断该药品是否有效. 在实际试验中,处理组中的个体由于自己的身体状况差异、对药品的反应程度不同、或害怕副作用等因素,可能出现不依从或部分依从的情况,传统的ITT(intention2to2t reat) 分析方法不管受试者是否实际服药,仍按照他们被分配的组对待,来比较两组个体的平均效果,这实际上是在讨论处理分配(而不是处理本身) 的平均因果作用,这种仅仅比较两组受试者的平均效果将会忽略药品的真正作用,从而不能正确获得药品的真正因果效应,因此ITT统计量有一定的局限性,很多文章对此作了较详细的讨论[122 ] .
一种简单的处理不依从的方法是将依从性作为二值变量:完全依从或完全不依从. Angrist 等在文献[ 2 ]中,通过定义工具变量( Inst rumental Variable) 的方法,获得了依从子总体的平均因果效应CACE(Complier Averge Causal Effect ) 的估计量IVE ( Inst rumental Variables Estimate) , Imbens 等在文献[ 3 ]中用Bayesian 方法对这类情况进行了讨论,获得了一些相应的结果. 对于药品的平均因果效应ACE(Average Causal Effect) ,Balke and Pearl[4 ] 对于二值依从情况,利用线性规划的方法获得了它的上下界. 利用该文所提供的方法,有时会出现下界为负数的情况,这样的下界没什么实际意义. 对于部分依从的情况,该文也进行了处理,其具体方法是忽略部分依从的那部分数据,仅利用完全依从和完全不依从两部分数据,来估计ACE 的上下界,这显然是不合理的.


本文在文献[ 2 ]中的某些假设前题下,提出一种计算ACE 上下界的方法,其下界不会出现负数的情况,估计区间比文献[ 1 ]中的估计区间要小. 同时,还讨论了部分依从情况下,平均因果效应ACE 的上下界问题,并给出了具体的计算方法.本文第2 节主要描述处理─对照试验中所涉及的问题和现象,列举了该试验问题中的一些合理的假设条件;第3 节对试验中所涉及的数据结构进行了分析;第4 节讨论了在对照组中的受试者不能得到药品的前题下,平均因果效应的上下限. 第5 节讨论了对照组中的受试者能够得到药品的情况下,平均因果效应的上下限;第6 节讨论了出现部分依从情况下,平均因果效应的上下限;第7 节对实例进行了具体分析计算;最后是对本文所使用的方法及其结果进行总结.2  问题的描述设试验中有N 个受试者,第i 个受试者用编号i 表示, i = 1 , 2 , ⋯, N ,将他们随机分成处理组( Z =1) 和对照组( Z = 0) . 对处理组中的人,分配给药品,而对照组中人则分配安慰剂. 先考虑不出现部分不依从的现象,即对于所有受试者,要么就完全依从,要么就完全不依从. 设D 为依从水平, D = 0 表示不依从,而D = 1 表示依从,不出现部分依从现象,记Y 为响应值, Y = 1 表示药品有效, Y = 0 表示药品无效. 一般情况下, D 是Z 的函数,也就是说,分配在处理组中的人和分配在对照组中的人,其依从性是有差异的,记此函数为D( Z) ,而Y 是D 和Z 的函数,记为Y ( Z , D( Z) ) . 为了讨论问题方便起见,先给定一些相关的假设.假设1 (随机分配)  ( Y , D) ⊥Z.即受试者的依从性及其效果响应变量与分配是独立的.


假设1 成立时,有下式成立:P( Y = y , D = d| Z = 1) = P( Y = y , D = d| Z = 0) , d = 0 ,1 ; y = 0 ,1.假设2 (排斥限定)  响应值Y 仅与D 的值有关,而与分配Z 的值无关. 在实际试验中,在随机分配的前题下,通过双盲试验,这一假设条件可以满足.由此可得, Y (1 , d) = Y (0 , d) , d = 0 ,1 ,故可记Y ( Z , D( Z) ) 为Y ( D) .假设3 (依从的单调性)  D(1) ≥D(0) .该条件可放宽为D(0) = 0 ,此时,分配到对照组,将得不到真正的药品.假设4 (剂量单调性)  Y (1) ≥Y (0) ,即服药的效果不会比不服药的效果差,这一假设表明该药品无副作用.假设1 、2 、3 是IV 变量( Inst rumental Variables) 所要求的.3  数据结构现由于p00 = P( Y (0) = 0 , D = 0| Z = 1) 表示处理组中不依从者无效的概率,或说处理组中的人未服药时无效的概率,可将其分成两部分: P00 =μ01 +μ02 ,其中:μ01 = P( Y (0) = 0 , Y (1) = 1 , D = 0| Z = 1) ,表示处理组中的不依从子组中,不服药时无效,但如果服药时则有效的概率;μ02 = P( Y (0) = 0 , Y (1) = 0 , D = 0| Z = 1) = P( Y (1) = 0 , D = 0| Z = 1) ,表示处理组中的不依从者即使服了药也无效的概率.而p11 = P( Y (1) = 1 , D = 1| Z = 1) ,表示处理组个体依从者服药后有效的概率,同样可将其分成两部分: p11 =μ10 +μ11 ,其中:μ10 = P( Y (0) = 1 , Y (1) = 1 , D = 1| Z = 1)= P( Y (0) = 1 , D = 1| Z = 1) ,表示处理组中依从者不服药也有效的概率;μ11 = P( Y (0) = 0 , Y (1) = 1 , D = 1| Z = 1) ,表示处理组中依从者服药有效,但如果不服药则无效的概率. 记:μ00 = p01 = P( Y (0) = 1 , D = 0| Z = 1) ,表示处理组中不依从者不服药也有效的概率;μ12 = p10 = P( Y (1) = 0 , D = 1| Z = 1) ,表示处理组中依从者服了药也无效的概率.按上述划分方法,综合依从者和不依从者两部分数据,可将处理组中的人分成3 类:(1) 不服药也有效,其概率为:μ00 +μ10 ;


 (2) 不服药无效,但服药有效,其概率为:μ01 +μ11 ; (3) 服药也无效,其概率为:μ02 +μ12 .记t = 0 ,1 ,2 分别表示上述3 种情况,则可用表2 来表示它们之间的关系.由此可知,依从组的平均因果效应为:CACE = P( Y (1) = 1 , D = 1| Z = 1) - P( Y (0) = 1 , D = 1| Z = 1) = (μ10 +μ11 ) - μ10 =μ11 .而平均因果效应为:ACE = (μ00 +μ01 +μ10 +μ11 ) - (μ00 +μ10 ) =μ01 +μ11 .4  D(0) = 0 条件下因果效应的上下限本节设上节中的假设1 ———假设4 均满足,由单调性假设3 可知,对照组中的人将不能得到真正药品. 由于D(0) = 0 ,则必有q10 = q11 = 0 ,故我们可仅考虑q = q01 ,1 - q = q00 .在对照组中, q 表示已恢复的人在本组中所占的比例,即q = P( Y (0) = 1| Z = 0) ,由假设,他们不能得到药品,属于未服药而有效的那部分人所占的比例.在处理组中,由上节的分类可知,不服药已有效的概率为:P( Y (0) = 1| Z = 1) = P( Y (0) = 1 , D = 0| Z = 1) + P( Y (0) = 1 , D = 1| Z = 1) =μ00 +μ10 .由排斥限定假设,响应值Y 仅与D 的值有关,而与分配Z 的值无关,即有:  q = P( Y (0) = 1| Z = 0) = P( Y (0) = 1| Z = 1) =μ00 +μ10 ,由此可得下列方程组:q =μ00 +μ10 , p01 =μ00 , p11 =μ10 +μ11 , p00 =μ01 +μ02 .此时,依从组的平均因果效应CACE =μ11 ,可以证明,此即为IV 估计量.对于总体平均因果效应ACE ,从两个方面考虑:(1) 由于ACE =μ01 +μ11 =μ01 + p11 + p01 - q ,且μ01 = p00 - μ02 ≤p00 ,μ01 ≥0 ,故有:p11 + p01 - q ≤ACE ≤p11 + p01 + p00 - q = 1 - p10 - q.从上式可看出:ACE 的上界是对照组中无效的人的比例与处理组中依从者无效的比例之差,而下界是处理组中有效的人的比例与对照组中有效的人的比例之差,这一结果有一定的直观性.


此时估计区间的长度是:1 - p10 - q - p11 - p01 + q = p00 .(2) 由于1 - q = q00 是对照组中无效的人所占的比例,同样可分为两部分:1 - q =θ0 +θ1 ,其中,θ0 为对照组中服药也无效的概率,而θ1 为对照组中不服药无效,但如果服药则有效的概率. 由前面的假设可得:μ12 +μ02 =θ0 ,μ11 = p11 + p01 - q ,μ02 =θ0 - p10 ,μ01 = p00 - μ02 = p00 + p10 - θ0 ,] ACE =μ01 +μ11 = p00 + p01 + p10 + p11 - q - θ0 = 1 - q =θ0 =θ1 , ] 0 ≤ACE ≤θ1 ≤1 - q.综合(1) 及(2) 可得: max (0 , p11 + p01 - q) ≤ACE ≤1 - p10 - q.在本节的假设条件下,Balke A 和Pearl J (1997) 的文章中的上下界公式可化简为:max (0 , p11 - q) ≤ACE ≤1 - q - p10 .估计区间的长度是:1 - q - p10 - p11 + q = p10 + p00 .从上面结果可知,两种估计的上界是一致的,而前者的下界明显大于后者的下界.5  取消单调条件时因果效应的上下限其中, p01 +μ10 =μ00 +μ10 表示处理组不服药也有效的概率,而q01 +θ10 =θ00 +θ10 表示对照组中恢复的概率. 同样,我们从两个方面讨论其因果效应:(1) 由μ10 = q01 - p01 +θ10 ,有:μ11 = p11 - μ10 = p11 + p01 - q01 - θ10 ,故:ACE =μ01 +μ11 = p11 + p01 - q01 +μ01 - θ10 . 由于0 ≤μ01 ≤p00 ,及0 ≤θ10 ≤q11 ,有: p11 + p01 - q11 -q01 ≤ACE ≤p00 + p01 + p11 - q01 = 1 - p10 - q01 .同样,下界是处理组中所有有效的受试者所占的比例与对照组中所有有效的受试者所占的比例之差.(2) 由μ02 = q10 - p10 +θ02 ,有:μ01 = p00 - μ02 = p00 + p10 - q10 - θ02 ,μ11 = p11 - μ10 = p11 + p01 - q01 - θ10 .于是,有: ACE =μ01 +μ11 = p11 + p01 + p00 + p10 - q01 - q10 - θ10 - θ02 =1 - q01 - q10 - θ10 - θ02 = q00 + q11 - θ10 - θ02 .由于θ10 ≤q11 ,θ02 ≤q00 ,故有:0 ≤ACE ≤q00 + q11 .综合(1) 及(2) 的结果,可得:max (0 , p11 + p01 - q11 - q01 ) ≤ACE ≤min (1 - p10 - q01 , q00 + q11 ) .区间的长度≤1 - p10 - q01 - p11 - p01 + q11 + q01 = p00 + q11 .从上述结果可以看出,ACE 的上界所涉及的两项是Balke A 和Pearl J 的文章[4 ] 中8 个概率中的两项,从理论上讲,文献[4 ]中的上界比本文的上界要小,因而可以将Balke A 和Pearl J 文章中的上界作为ACE 的上界,而本文的下界一般来说要比Balke A 和Pearl J 文章中的下界大.6  部分依从的情形下因果效应的上下限本节设依从单调性假设3 及剂量单调性假设4 成立,此时,不允许对照组中的人服药,考虑处理组中有部分依从现象,即处理组中有不依从、部分依从和完全依从3 种情况,我们分两种情况讨论.


(1) 将依从性分为3 个等级,即反映依从性的量D 可取3 个值, D = 0 表示不依从, D = 1 表示部分依从, D = 2 表示完全依从. 由于此时对照组中的人得不到药品对处理组中的受试者,将剂量响应分成4 种不同情况:t = 0 :表示不依从也有效的概率; t = 1 :表示部分依从时有效,但如果不依从则无效的概率; t = 2 :表示部分依从时无效,但如果完全依从则有效的概率; t = 3 :表示完全依从时也无效的概率.用前面所采用的方法,将所有pij ( i = 0 ,1 ,2 ; j = 0 ,1) 进行分解,可得结果如表5 所示. 此时,ACE =μ01 +μ02 +μ11 +μ12 +μ21 +μ22 .类似前面的讨论,可得下列各等式:   μ00 = p01 ,μ01 +μ02 +μ03 = p00 ,μ10 +μ11 = p11 ,μ12 +μ13 = p10 ,μ20 +μ21 +μ22 = p21 ,μ23 = p20 ,μ00 +μ10 +μ20 = q ,] μ21 +μ22 = p21 - μ20 ,μ01 +μ02 = p00 - μ03 ,μ11 = p11 - μ10 ,μ12 = p10 - μ13 ,μ10 +μ20 = q - μ00 ,] ACE = p21 + p00 + p11 + p10 - μ20 - μ03 - μ10 - μ23 =p21 + p00 + p11 + p10 + p01 - q - μ03 - μ13 = 1 - p20 - q - μ03 - μ13 .由于0 ≤μ03 ≤p00 ,0 ≤μ13 ≤p10 ,可得:1 - p00 - p10 - p20 - q ≤ACE ≤1 - p20 - q.另一方面,设1 - q =θ0 +θ1 +θ2 ,其中,θ0 、θ1 、θ2 分别表示对照组中服满剂量也无效、服部分药无效但满剂量服药有效及不服药无效但服部分药有效的3 种情况,于是有:θ0 =μ03 +μ13 +μ23 =μ03 +μ13 + p20] ACE = 1 - q - θ0] 0 ≤ACE ≤1 - q.8  总结本文利用文献[2 ]中对处理—对照试验中定义工具变量IV 的一些假设条件,讨论了不同情况下平均因果效应ACE 的上下界的计算方法. 对于二值依从的情况,本文分别讨论了依从的单调性假设成立和不成立两种情况下,得到了ACE 上下界的计算方法,所得到的上界与Balke 和Pearl [4 ] 的上界是一致的,而下界则明显比文献[4 ]中的下界大,因此,其估计区间要比文献[4 ]中的估计区间小.


对于出现部分依从,即依从性为多值变量的情况下,本文充分使用原始数据,给出了ACE 上下界的计算方法,这一结果比Balke 等[1 ] 将这种情况简单地处理成二值变量来计算其上下界要明显合理一些.


参考文献:
[1 ] Robins J M , Greenland S. Adjusting or differential rates of pcp prophylaxis in high2versus low2dose act t reatmentarms in an aids randomizied t rial [J ] . Journal of the American Statistical Association , 1994 , 89 : 7372749.[2 ] Angrist J D , Imbens G W, Rubin D B. Identification of causal effecs using inst rumental variables[J ] . Journal of theAmerican Statistical Association , 1996 , 91 : 4442471.[3 ] Imbens G W , Rubin D B. Bayesian inference for causal effect s in randomized experiment s with noncompliance [J ] .The annals of statistics , 1997 , 25 , 3052327.[4 ] Balke A , Pearl J . Bounds on t reatment effect s f rom studies with imperfect compliance [J ] . Journal of the AmericanStatistical Association , 1997 , 92 : 117121176.[5 ] Ef ron B , Feldmen D. Compliance as an explanatory variable in clinicalt rials [J ] . Journal of the American StatisticalAssociation ,1996 , 86 : 9225.[6 ] Goetghebeur E , Molenberghs G, Katz J , Estimating the causal effect of compliance on binary outcomes in randomizedcont rolled t rials[J ] . Statistics in Medicine ,1998 , 17 : 3412355.[7 ] Holland P W. Statistics and causal inference[J ] . Journal of the American Statistical Association , 1986 , 81 : 9452970.[8 ] Dale J . Global cross2ratio models for bavaria discrete ordered responses[J ] . Biomet rics , 1986 , 42 : 9092917.[9 ] Sommer A , Zeger S L. On estimating efficacy f rom clinical t rials[J ] . Statistics in Madicine , 1991 ,10 : 45252.