张玉哲:药物经济学评价中的贝叶斯法介绍


 

药物经济学评价中的贝叶斯法介绍
2009-6-16
  摘要21世纪是贝叶斯统计的世纪,其作为两大统计学派之一,已被越来越多地应用于包括医疗在内的科学、技术、管理、商业等多个领域。本文从贝叶斯法的原理、概率含义、计算技术等方面较全面地介绍了贝叶斯法,以促进贝叶斯法在药物经济学评价中的应用。贝叶斯法的优势主要体现在先验信息的应用及推测方面,而马尔可夫链蒙特卡洛模拟技术(MCMC)使得贝叶斯法的这种优势在计算技术中得以实现,其计算过程是通过从后验分布中随机抽取一个大样本来形成贝叶斯推断。贝叶斯法可以在理论上准确地提供药物经济学中增量成本,效果比(1CER)、成本—效果可接受曲线(CEAC)、净货币收益(NMB)和净健康收益(NHE)的概率阐述。
 
  关键词:贝叶斯,MCMC,药物经济学
 
  中国药物经济学研究和应用促进项目特稿
 
  贝叶斯定理(Bayes’Theorem)源于1763年英国学者贝叶斯发表于皇家学会学报上的论文——《论机会学说中一个问题的求解》(《An Essay Towards Solving a Problem in the Doctrine of Chances》),后来文中提出的有关二项分布参数推断的方法被称为贝叶斯定理,并被推广到二项分布以外的其它统计分布应用中。20世纪50年代以后,通过De Finetti、Savaga、Raiffa、Schlaifer、Jeffreys、Good等统计学家大量开拓性的研究工作,贝叶斯统计推断理论获得了迅速发展和完善。当今,贝叶斯统计已经成为与经典统计学(频率法,Frequentist Statistics)派并驾齐驱的两大统计学派之一。统计学家Lindely认为21世纪是贝叶斯统计的世纪。
 
  21世纪,贝叶斯法在科学(自然科学和社会科学)、技术、管理、商业等多个领域得到了人们的普遍关注,卫生经济学领域也同样如此。英国国立卫生研究院(National Institute of Clinical Excellence,NICE)在临床和经济研究指南中明确指出接受采用贝叶斯法。而美国FDA也同样接受采用贝叶斯法的注册申请,尤其在医疗器材领域。概括来说,贝叶斯法有如下优势:(1)能够比传统的频率法提供更合乎常理和更有用处的推断;(2)能够利用更多的可获得的信息,因此与频率法相比能够产生更稳健的结论;(3)与频率法相比,能够处理更加复杂的问题;(4)贝叶斯法用于决策制定过程是理想的,而频率法却因受限于统计分析技术,只能间接地提供决策信息;(5)在需要做出推断时,贝叶斯法比频率法更加明晰。
 
  一、贝叶斯法原理
 
  数据的作用是丰富我们的知识并更新我们对参数以及相关假设的认识。鉴于此,无论想要从一组新数据中学到什么,我们都需要识别在观察新数据之前我们已经具有的知识。这被称作先验信息。为了解释贝叶斯法的运行原理,我们作以下简单假设:对统计模型的未知参数来说,先验信息已经被识别并且以统计模型的未知参数的先验分布形式表达出来。先验分布表达了在遇到新数据之前已知的或被视为真实的信息。接着,通过这些信息与新数据中信息的综合来产生后验分布,它表达了我们在接触数据之后对参数的认识(常把先验分布和后验分布称为“先验”和“后验”)。把先验信息与新数据中信息进行综合的数学机制称为贝叶斯定理,用这种方法做统计被称为“贝叶斯法(Bayesian)”。简单说,贝叶斯理论就是把先验概率密度函数和似然密度函数(通过经验数据得到)相乘从而形成用于推断的后验分布。
 
  借用字母θ表示关注的参数是表达贝叶斯定理的一种常用方法。θ也可以视作随机参数向量,它与直接来源于调查研究的数据y的概率密度函数相关。给定一个概率密度函数P(),贝叶斯定理表达如下:
  P(θ/y)表示后验分布:P(θ/y)表示y的似然函数(即在关注的参数和自变量既定的条件下,因变量的条件概率);P(θ/y)表示θ的先验概率。
  图1被称作“三线图”,该图充分展现了贝叶斯法综合两种信息来源的方式和过程,即该图简述了贝叶斯过程。曲线的宽窄程度体现了它所代表的信息的强度——较窄的曲线表示的参数的取值范围较窄,因此代表的信息较强。从图1可以看出,新数据(红色曲线)比先验数据(灰色曲线)多提供了一些信息。贝叶斯理论能识别每种来源信息的强度,图1中的后验(黑色虚线)受新数据的影响比受先验的影响更大一些。后验曲线比先验曲线和新数据曲线都要窄,反映了综合了两种来源的信息后,后验信息强度的增加。新数据曲线又称作似然(Likelihood),它在频率法的推断中也很重要。新数据在贝叶斯法和频率法中的作用是相同的,都是描述数据对参数的多种可能值的支持强度。两种方法最明显的不同是频率法仅使用似然函数,而贝叶斯法同时使用似然函数和先验信息。
 
  在图1中,仅使用新数据信息(红色)的频率法的估计值是1.5左右。而贝叶斯法中,先验信息(灰色)显示参数值基本处在—4和+4之间(更可能的是在-2和+2之间),于是0是最好的估计值。因此,结合了先验信息和数据信息后,贝叶斯估计值大约为1。贝叶斯法综合了先验信息和新数据信息,它是先验信息和新数据估计的一个折中选择,能够进行更加准确的估计(这体现了贝叶斯统计的第二个优势)。根据贝叶斯理论,我们想要的任何推断都来源于后验分布。参数的估计值可能是后验分布的一种形式,如它的极大值点,也可能是后验期望。如果我们做出一个假设,那么这个假设成立的概率也同样来源于后验分布。以图1为例,参数为正的概率是黑色虚线下到原点的面积(0.89)。
 
  频率法必须把所有的问题都表达成显著性检验、置信区间和无偏估计的形式,而贝叶斯推断可以灵活使用后验分布来为所有问题提供直接的答案。贝叶斯统计和决策理论间的自然联系就是一个很好的例子。如果我们知道参数值,做出决策是容易的——我们可以选择在给定这些参数值情况下能够使效用最大化的决策。然而,参数值一般是未知的。根据决策理论,应该选择能够使期望效用最大化的决策(期望指平均效用值,涉及参数后验分布的平均化)。而贝叶斯理论通过后验分布和效用函数(用于测量不同决策的结果)的结合,使我们可以找出使期望效用最大化的最佳决策。如,医疗服务提供者要在两个项目中选择其中的一个进行报销,依据贝叶斯理论,就可以选择一个具有较大净收益(平均效力与每单位效力的支付意愿的乘积减去期望成本)的项目。而频率法却无法给出类似的合适答案,因为频率法只能假设一个项目的收益大于另一个项目然后做检验(这体现了贝叶斯统计的第四个优势)。
 
  二、贝叶斯法与频率法在概率方面的差异
 
  从前文的叙述中可以看出,贝叶斯法和频率法的一个主要差异在于先验信息的使用与否,频率论者在分析中通常只是非正式地考虑当前信息,而贝叶斯法正式把先验信息结合到分析中。另外,贝叶斯法和频率法的本质差别还在于概率、参数和推断方面(见表1)。
  频率法和贝叶斯法基于不同的概率观念。频率法认为概率揭示了在潜在的真实状态下,对可重复观测事件的相对频数的观察,认为只有重复发生的事件才具有概率。而在贝叶斯法中,认为概率仅是当前信息状态下对事物信任的程度。概率是用于描述不确定性的,此处指最广泛意义上的“不确定性”。一个事件可能由于受随机变化的影响导致其自身具有不可预测性,从而具有不确定性,如一个随机抽样的病人对药物的反应;由于我们没有掌握事件的全部信息也能导致事件的不确定性,如总体中所有病人对药物的平均反应。频率法只认可第一种不确定性,而贝叶斯法可以很好地把以上两种不确定性都包含进来。
 
  统计方法的形成通常伴随着推断未知参数(参数代表了未知事物,通常会体现作为数据来源的总体的性质)的过程。任何关注的问题都可以表达为对未知参数的疑问。频率法和贝叶斯法对概率的观点的差异之所以重要,是因为它会从根本上影响我们对参数的理解。因为参数针对特定的问题,通常不会受随机变化率的影响,所以频率法认为参数不是随机的,而且关于参数的概率性阐述也是无意义的。相反,从贝叶斯角度,由于这些参数值的未知性,对参数的概率性阐述是完全合理的。举个例子,对医疗服务提供者来说,假设治疗方案2会比方案1更具成本—效果,这里的未知参数是每种方案下接受此医疗服务的所有患者的平均成本和平均效力(Efficacy)。从贝叶斯法角度,可以通过计算出方案2比方案1更具成本—效果的概率来得到此题的分析结果。而从频率法角度,方案2是否比方案1更具成本—效果是一个单向的命题,它涉及特定背景下的两个特定治疗方案,而且是不可重复的,我们不能谈论它的概率。频率法可以通过假设检验来判断方案2是否比方案1更具成本·效果,且得到相应的P值。
 
  三、贝叶斯法的计算技术
 
  研究者对贝叶斯法一直有着浓厚的兴趣,但因为缺乏必要的计算工具和软件,直到20世纪90年代贝叶斯法都没有得到普遍应用。然而在近十多年的时间里,这种状况得到巨大改善。专门针对贝叶斯分析的计算工具得到广泛开发,贝叶斯工具因为能够处理频率法无法涉足的极其复杂的问题而显现出它的强势。
 
  马尔可夫链蒙特卡洛模拟技术(Markov Chain Monte Carlo,简写MCMC)使贝叶斯计算技术发生了革命性的突破。其基本原理是通过从后验分布中随机抽取一个大样本来形成贝叶斯推断。而需要获得的关于后验分布的任何信息都可以通过对样本计算而得到。此处指的样本并不是样本数据(通常我们并不能控制样本数据的数量),而是指通过随机模拟方法人工产生一个相关参数的样本。严格来说,从后验分布中获得大样本的思路来源于蒙特卡洛模拟。而MCMC与单纯蒙特卡洛模拟技术相比的优势在于样本抽取方式。可以拿纸牌游戏来比喻单纯的蒙特卡洛模拟——在参数值的所有可能范围内随机“扔”点,点与点之间相互独立。然而,这对贝叶斯分析来说是不现实的,因为在一个有多个可能参数值的模型中,要建立一个有效算法是极其困难的(要在随机“扔”点的同时又依赖于后验分布)。而MCMC却可以使点围绕可能的参数值来移动。从技术上说,马尔可夫链模型产生了这个移动的点,而此过程的连续进行就产生了样本。建立马尔可夫链是相当容易的,这也使样本能取自任何想要的后验分布。
 
  当前贝叶斯计算使用的主要工具是MCMC。因为贝叶斯法比频率法要复杂得多,尽管学术界能很好理解这种计算技术,但对普通用户而言,贝叶斯法仍然缺乏界面友好的软件。当前较普遍使用的是First Bayes和WinBUGS,而功能强大同时又界面友好的软件包几乎是不存在的。贝叶斯统计工具还有待发展,使贝叶斯法从劣势(复杂性和软件的缺乏)更多地转向优势(处理更加复杂问题的能力)。
 
  四、贝叶斯法在药物经济学中的应用
 
  随着各国医疗系统对效率的更高追求,医疗技术的经济学评价已经进入到评价报销措施影响等更宽泛的政策领域。然而,频率法却无法正式或全面地评价这些结果涉及的问题。贝叶斯法已经应用到从实验性(如测量安全性和效力的临床试验)到观察性(如关注效果的回顾性数据)的大量研究设计中。当评价医疗技术时,除了要考虑使用恰当的概率分布来表达不确定性之外,无论是选择贝叶斯方法还是频率法的分析者都必须考虑临床试验数据的多个方面(如,研究设计、抽样方法等)。医疗技术变化的增量性质使得像贝叶斯框架这样的模型更加适用,即与一次独立的调查研究相比,对当前信息的不断整合可以对决策制定产生更大的帮助。
 
  诊断性筛查或试验与药物动力学的频繁使用揭示了贝叶斯法在临床决策制定中的作用。如在做出不同诊断的过程中,对一个特定试验的解释直观上是基于先验信息的;对一系列诊断程序的连续评估有利于对某种状况的最终评价,而这些诊断程序的选择和反复修正又基于连续评估所提供的信息。一般来说,贝叶斯法在这种情况下是容易接受的,因为决策的制定过程和贝叶斯过程是相似的。
 
  在临床试验中进行药物经济学分析,贝叶斯法也有很大优势。临床试验通常是连续的,而且很大程度上基于先前的临床证据,因此贝叶斯法本质上就适用于设计临床试验。使用贝叶斯法进行临床试验设计的大量文献都与成本—效果试验相关。成本—效果试验总会有先验的临床信息,可能还会有某种形式的经济信息。贝叶斯分析通过阐述要获得怎样的效果来形成先验信息,如在设计Ⅲ期临床试验时,将会有来自Ⅱ期临床试验的信息用于形成效果的先验分布,这是设置样本大小的有益途径。另外,贝叶斯法在成本—效果分析中的应用大部分集中在贝叶斯法在推测方面的优势。更具体地说,贝叶斯法可以在理论上准确提供增量成本—效果比(ICER)、成本—效果可接受曲线(CEAC),以及净货币收益(NMB)和净健康收益(NHE)的概率阐述。
 
  五、贝叶斯法的主要争议
 
  贝叶斯法也不是没有缺陷的。事实上,在国际统计学术界中,贝叶斯统计和经典统计(频率法)这两大学派之间长期存在争议,至今没有定论。
 
  先验信息是贝叶斯法的一个优势同时也是一个潜在的劣势。我们已经了解了贝叶斯法怎样通过先验信息来获得更多的信息和更强的推断,但另一方面,对贝叶斯法的大多数批评都集中在先验信息上。最基本的批评是先验信息的主观性,如A的先验信息与B的不同,于是,A的先验分布与B的先验分布就不同。这使得后验分布和所有源于先验信息的推断都是主观的。从这个角度可以说整个贝叶斯法都是主观的。对许多想尽办法排除主观性的学者来说,贝叶斯法为获得这个优势而付出的代价实在太大。对贝叶斯法的批评者来说,“主观性”是贝叶斯法的主要缺陷。
 
  然而有学者相信,无论在理论上和实践上这种反对都是无依据的。他们认为,在理论上科学本来就不可能绝对客观;而在实践上,贝叶斯理论其实是非常严密地反映了科学方法的实质。原因是贝叶斯法通过使先验分布基于可辩护的证据和推理,而使先验分布的主观性达到最小化,而且通过数据的积累,可以解决源于先验信息的差异,并且达成一致。
 
  尽管意识到对贝叶斯法的争议,致力于贝叶斯法研究的学者们深信,随着时间的推移,贝叶斯法的缺陷是能够被克服的。而目前关于统计领域的两个学派,学者们认为都有其广阔的发展前景,在使用上是相辅相成的。
 
 

 

作者:沈阳药科大学工商管理学院硕士研究生 张玉哲 吴晶 天津大学药物科学与技术学院 孙利华 来源:《中国药物经济学》2009年第2期