临床终点指标对于研究干预措施与疗效之间的因果关联具有十分重要的作用,采用不同的终点指标可以得出有效、无效甚至截然相反的结论。传统的中医临床终点指标只重视症状和体征,或者简单地采纳西医生物医学模式的替代指标,缺乏循证医学所关注和评价的终点指标,使得中医药的成果缺乏说服力,难以得到国际认同。中医指导临床的特色是“辨证论治”,中药及复方成分具有多样性,因而其疗效也具有多效性、多途径、多靶点的“复杂干预”特点。因此,如何选择既能体现中医药的诊疗特色,又能客观地评价中医临床疗效的终点指标,是目前中医临床疗效评价亟待解决的关键问题。
1 中医临床疗效评价终点指标的研究现状
中国循证医学中心李幼平教授在《循证医学研究进展》的报告中指出:“判定一个治疗是否有效,不是靠中间指标,要靠终点指标”。目前,西医在研究某种干预措施的临床疗效及预后影响的评价中,已越来越多开始涉及到终点指标。如孙文荣等选取梗死后心绞痛、梗死延展、脑卒中、死亡等终点事件评价他汀类药物对急性心肌梗死患者的影响。但中医药临床研究文献的系统评价发现,观察指标的选择不尽理想,缺乏对终点评价的关注。究其原因,关于终点指标的研究较少,有关终点指标的概念和特点认识不清,选择缺乏依据和方法指导。
1.1 关于终点指标的研究较少 终点指标是真正的疾病结局,是患者最为关心的事件,具有重大的临床意义及临床参考价值,但终点指标出现较晚,试验所需时间长,且易受其他非干预因素干扰,通常在大样本、长期临床试验中采用。由于终点指标发生率低,进行大样本长期临床研究须以增加人力、物力和财力投入为保证,而很多临床试验并不具备相应条件,以致以终点指标为结局评价的临床研究较少。在新药临床试验的Ⅱ、Ⅲ期临床研究中多采用替代指标作为主要疗效指标以缩短临床试验时间,节约成本。许多大规模临床研究也未采纳终点评价,例如,参松养心胶囊治疗室性早搏的多中心随机对照研究中,所选观察指标为用药前后主要临床症状、24 h动态心电图室性早搏数目,以及血、尿、便常规,肝肾功能等指标的变化及不良反应,未涉及终点指标评价。
1.2 对终点指标的概念和特点认识不清 终点指标,一般是指对患者影响最大的,患者最为关心、与患者切身利益最为相关的事件,包括患者生存或死亡、残障水平或其他一些重要临床事件(如疾病复发等),能够客观反映真正的干预效果,通常在大样本长期随访的临床试验中进行测量。但目前不少研究者对终点指标的概念和特点认识不清。究其原因,首先,终点指标应用于中医临床时间较短,许多研究者对终点评价接触不深,不甚了解。其次,限于人力、物力、财力等问题,不少研究者将替代终点、症状功能、生存质量等指标当作终点指标参与评价。因其用于临床试验时数据收集简单易行,且更易得到阳性结果,因而更受临床研究者的青睐,继而混淆概念成为终点指标。例如,在临床新药的研发中,很多研究者主张将症状和功能评价作为临床疗效评价的中间终点,将生命质量的改善,症状的好转作为新药上市的理论依据。此外,很多研究者认为所选指标应能体现中医药“辨证论治”特色。刘凤斌等提出中医证候应作为中医药临床研究的主要结局指标,用治疗前后证侯疗效评价积分评价临床疗效。我们必须认识到,虽然这些指标也属于有效性指标的一部分,但其对疗效的论证强度远远不及终点指标。有关主观症状、功能状态、生存质量等属于软指标,其存在评价标准不统一、受检查者主观判断影响大、可重复性差等缺点,用作临床疗效评价指标均存在客观性不足的问题。客观性强、可重复性高的终点指标是临床试验结局指标的最佳选择。
1.3 关于终点指标的选择缺乏依据和方法指导 选取合适的临床评价终点指标虽然关键,但目前没有公认的方法能给予指导,大多数试验仍是结合研究目的、临床经验、专家意见甚至照搬西医临床评价的终点指标,缺乏具有中医特色的指标。目前终点评价应用于中医临床研究时间尚短,由于研究经验不足,且意见多带有专家个人观点,主观性较强,客观性不足,具有一定局限性。因此,终点指标的选择尚无公认的选择依据及方法能给予指导,进行终点评价时多照搬西医指标,未能体现中医临床特色。例如,步长脑心通对心肌梗死二级预防的临床观察中,所选观察终点指标为急性再梗死、血运重建、严重心衰、心源性猝死、脑卒中等,均为西医终点评价指标,缺乏具有中医药治疗特色的指标。
2 中医临床疗效评价终点指标的选择思路
2.1 体现中医临床治疗的特点和优势 人体是一个复杂机构,疾病也具有复杂性(多因果、多通道),治疗同样具有复杂性(多治疗、多效应),使得干预结果和疗效也具有复杂性。首先,中药药物成分具有多样性,且中医药治疗疾病时多用复方,药物之间配伍又有相辅相成、相反相成的相互作用特点,其作用机制更为复杂。中药复方丹参滴丸由丹参、三七、冰片组成,现代药理研究证明,其有保护心肌、保护血管、改善血液流变学特性,可从三方面发挥药理作用,充分体现中医药多靶点的作用优势。其次,中药作用具有多层次效应。中国冠心病二级预防研究中,就达到随诊终点的80例癌症患者进行对比分析,结果长期用血脂康治疗可降低癌症事件与死亡的相对风险分别为42.4%与57.4%,体现中药的多组分和多效性。提示我们,临床疗效评价应以全面、客观、综合为原则,建立包含次效应、弱效应、间接效应的指标体系,充分体现中医重视整体调节,多靶点、多效应的作用优势。第三,中医药长于治疗慢性疾病,且中药制剂作用缓和,适宜作为二级预防长期用药,应当在远期预后终点事件方面选择多指标评价,可望获得中医药防治慢性疾病的全面证据。
2.2 依据终点指标特点
终点指标以对患者最直接、影响最大、患者最关心的、最想避免的临床事件为主要指标,具有权威性、重要性、客观性、时效性、敏感性的特点,在指标选择时不应忽视。首先,所选终点指标应具有权威性,即选择临床认可度高的指标。例如,心源性死亡是最严重的心血管不良事件,是心肌梗死必须观察的重要临床事件,也是最主要的终点事件,选择心源性死亡作为心肌梗死临床疗效评价终点指标,具有较高的临床认可度及权威性。第二,所选终点指标应具有客观性,即选择受主观因素影响小的指标。如死亡、残障等,以是否发生为依据,可客观判定,用于临床疗效评价时假阳性率低。第三,所选终点指标应具有临床重要性,即所选指标能够切实反映临床疗效。例如,对于骨质疏松患者选择终点指标时,骨折是患者最常发生、最为关心的事件,相比于死亡,显然骨折的发生情况更能体现临床疗效。第四,所选终点指标应体现时效性。在疾病的不同时期,终点事件发生风险不同。选择终点指标时应考虑终点指标发生时段的不同。例如术后缺血性脑卒中多发生于手术后3 d内,术后8 d后卒中发生率下降,在指标的选择时应考虑不同时段内终点事件发生情况。第五,所选终点指标应具有较高敏感性。不同的指标发生率不同,应选择相对敏感、发生率相对较高的指标。若选择的指标敏感性太低,会增加成本,造成不必要的人力、物力、财力的浪费,以及增加I类错误风险率等。
2.3 借鉴西医终点指标研究经验 中医药已沿用数千年,疗效是中医生存发展的关键。中医注重临床疗效,但缺乏疗效评价方法的研究,使得中医临床疗效始终存在争议。美国替代医学办公室(OAM)在1995年提交的替代医学研究方法论的报告中指出:“有效性评价是一个核心和关键的问题”“其疗效须用人们认可的终点指标来加以证实”。相对于中医,西医进行临床疗效终点评价时,具有两方面的优势。首先,西医临床疗效评价多选用世界范围内公认度高的终点指标,使得西医研究成果更易被国际主流医学所接受。其次,西医终点评价广泛应用于临床研究,经验丰富。中医终点评价可参考西医终点评价研究经验,丰富自身。国家“十五”公关项目芪参益气滴丸对心肌梗死二级预防的临床试验研究,采用大规模随机对照设计,选择75岁以下的心肌梗死恢复期的患者,芪参益气滴丸或肠溶阿司匹林干预12个月,平均随访37.15个月,结果试验组与对照组在复合终点事件、心血管病死亡、非致死性再梗、非致死性卒中方面组间无统计学差异,表明芪参益气滴丸对心肌梗死二级预防的作用与肠溶阿司匹林相当。这是第一个以心血管事件为终点的中医药心肌梗死二级预防研究,为开展中医药临床疗效的终点指标评价起到重要的推动作用。此外,中医与西医选择相似的疗效评价指标可进一步比较中西医作用的差别,更易体现中医作用优势或不足。但应当注意的是,中西医具有不同的理论体系,简单的将西医评价方法不加思考的照搬过来衡量中医疗效,存在极大的盲目性。借鉴西医终点指标的选择经验同时不能忽视中医药自身特点。
针对中医药所体现出的多靶点、多组分、多效应的“复杂干预”“整体调节”优势,借鉴西医终点指标选择经验,推荐设置联合指标全面评价临床疗效。一个结局指标只能反映疗效的一个方面,使用联合终点可使干预措施的疗效评价更加全面。此外,使用联合终点可提高事件总发生率,可有效解决终点评价所需样本量大、研究时间长、资金缺乏、终点事件发生率低的问题。但在使用多个终点应用时应对所选指标进行多重检验,需要在方案设计时制定出有效的策略和方法来事先控制I类错误率。当几个结局终点的重要性相似时,可将其设置成一个复合终点,可避免选择主要结局指标的争议。
3 中医临床疗效评价终点指标的选择方法
临床干预结局指标的选择有两个阶段,分为收集和优选。初步收集的临床干预结局指标数量较多,特异性不强。因此,需要进行优选,抓住主要指标,剔除次要指标,提高测量的精度与准确度。万霞等总结适合应用于临床干预结局指标收集和优选的方法主要有头脑风暴法、德尔菲法、哥顿法、系统评价、系统分析法及建立数学模型等。这些选择方法各有其特点,选择时要结合评价对象的特点,充分考虑这些差异可能给评价结果带来的影响。德尔菲法是针对所关心的问题选择一批专家,采用匿名多轮函询征求专家的意见。该法在很大程度上受专家经验的影响,属于一种主观定性的方法。目前终点指标用于中医临床疗效评价研究中经验尚少,研究经验缺失,不同专家对指标间的相关性看法不一,对于客观性、定量化的终点指标来说,经典的德尔菲法难以发挥其优选指标的作用。主观性较强的其他研究方法,如模糊综合评价、层次分析法、系统分析法等,均不适合终点指标的选择。在选择终点指标时,应尽量选择客观性较强的方法,如文献调查法、建立数学模型等。单一选择方法往往不可避免存在选择偏倚,因此采用多种指标选择方法对于临床疗效评价的终点指标是十分必要的。本文推荐采用文献调查(系统评价)、临床流行病学队列研究与数学模型综合运用的方法。
文献研究是中医药循证评价研究的基础工作。文献调查是一种全新的文献综述形式,其应用的关键问题在于文献阅读的全面性,全面收集所有公开、未公开发表的期刊文献、国家标准及教科书等,通过特定的标准筛选出符合标准、高质量的文献,再通过科学统计方法综合分析,得到筛选的终点指标集合。通过文献研究初步筛选出的指标集合,可为临床流行病学队列研究全面收集终点事件发生情况奠定基础。
临床流行病学队列研究是对个体及其暴露治疗情况进行长期的随访,能够获得客观结局发生的信息。其循证医学证据级别仅次于随机对照试验,在控制选择偏倚和减低失访的前提下,队列研究结果具有较高的信度。中国中医科学院陈可冀院士等对京津地区9家医院1 864例老年冠心病住院患者出院后1年的终点指标/事件发生情况进行随访,分析升高或降低终点事件发生情况的因素,对老年冠心病患者的二级预防具有一定临床指导意义。通过大规模临床流行病学队列研究可收集中医药治疗疾病不同时段的终点事件发生情况的原始数据,从而为构建数学模型计算各指标权重提供条件。
终点指标是一种定性指标,在数值类型上多是二分类变量,大多数只存在“是”或“否”两种结果,其权重是各个指标重要性的直接反映。采用各指标综合评价得分的数学模型,来处理中医药疗效评价研究中多指标结局的数据,既能反映终点指标的客观性定量化,又突显其重要性、时序性和发生率的不同。例如,在构建急性心肌梗死患者终点指标集合时,先采用文献调查法,初步筛选终点指标集合,为临床队列研究全面收集心肌梗死终点时间发生情况奠定基础。然后采用临床流行病学回顾性队列研究方法调查一段固定时间内急性心梗死患者终点事件的发生情况,构建临床急性心梗终点事件发生情况的终点事件集合,提供中医药治疗心肌梗死不同时段终点事件发生情况的原始数据,从而为构建数学模型计算各指标权重提供条件。然后通过构建心肌梗死患者终点事件发生情况的数学模型,与原始数据对比分析,进行临床评估,构建心肌梗死中医临床疗效评价终点指标集合。
在大数据时代,构建合适的数学方法选择终点指标将是研究主流。应注意的是,数学模型的结果需要与临床专业相结合,只有数学模型的结果和临床专业均有意义,这样的结果才是合理的。
4 结语
指标是评价的基石,选取和使用指标的方法不当,会使研究从一开始便陷入误区,最终得到的评价结论价值缩水甚至会误导临床工作。终点评价当依据指标的概念、特点、以及数据类型,有针对性地设计和建立指标集。中医药临床疗效终点评价是现阶段面临的难点,有赖于研究者对中医药干预特点和终点指标特点认识的进一步深入,同时要求以方法学创新为支持。选取公认的终点指标是中医药临床评价的必由之路。
|