查看更多
密码过期或已经不安全,请修改密码
修改密码壹生身份认证协议书
同意
拒绝
同意
拒绝
同意
不同意并跳过
苏州大学附属第二医院 靳勇 翻译
《美国肝病学会(AASLD)关于肝癌临床试验设计和终点的专家共识》的内容,对于肿瘤医生设计肝癌临床试验以及读懂肝癌临床试验的结果都起到很大的帮助作用。
本期为【9天读综述】的第二部分。
临床试验对于确定新的治疗干预措施的临床疗效至关重要,有助于制定临床实践指南,并形成循证医学的基础。一个充分的临床试验设计是至关重要的,因为一个有效的药物因一个糟糕的试验设计而被放弃,反之亦然。
设计临床试验时的主要考虑因素是:
a)选择明确的目标患者群体(即纳入和排除标准);
b)预先指定明确的终点(主要和次要)和数据分析计划;
c)指定随机化和分配方法;
d)随机分组的安全有效性(预后指标在入组时的分层)。
基于这些和其他变量,临床试验的质量可以使用不同的分数进行量化,例如,Jadad分数、Delphi列表、CONSORT标准和Cochrane回顾组标准。
SHARP试验证实,索拉非尼对晚期肝癌患者有益,在此之前,在肝癌患者中进行的试验质量一般不高。
一项系统回顾发现,根据改良的Jadad评分,2002年至2005年间报道的肝癌临床试验中只有50%被认为是高质量的。AASLD会议产生的2008年立场文件为学术中心、行业合作伙伴和监管机构设计HCC试验提供了一个有用的框架。随后,评估全身治疗的临床试验质量显著提高。其他治疗领域的高端临床试验活动较少。这份立场文件将广泛讨论HCC治疗各个临床方面试验设计的独特性。
在临床试验中,干预的益处是通过使用终点来量化的,终点是预先确定的事件,一旦达到,患者就不能在试验中进行进一步的评估。有3种主要的终点类型:硬性终点、替代终点和患者报告终点,所有这些都在其他地方有广泛的描述。
硬性终点定义良好,易于客观测量。硬性终点的原型是总生存(OS)率或癌症相关生存率。
替代终点,如无进展生存(PFS)期或进展时间(TTP),部分依赖于肿瘤反应的量化,通常使用成像技术和预先指定的标准。替代终点比硬性终点更容易受到攻击,但它们有几个优点,包括在事件累积和试验可行性方面的便利性。
患者报告的终点,有时被称为软终点,是主观指标,如生活质量(QoL),在大多数情况下,从问卷调查中获得。表1详细介绍了HCC试验设计和终点的总体建议,而这些试验中标准治疗干预的预期结果总结在表2中。
表1 由AASLD专家组对肝癌患者试验设计和终点的建议
目标 | 因素 | 建议 |
选择目标人群 | BCLC分期 | 根据具体的BCLC分期(0-C)入组患者 |
Child-Pugh 分期 | 入组肝功能Child-Pugh A的患者 考虑通过ALBI分级以及MELD得分对Child A的患者进行细化 | |
生物标志物水平 | 定义使用生物标志物和工具的理由 | |
选择终点 | 总体生存(OS) | 评估中期和晚期HCC治疗方法的II期和Ⅲ期研究的主要终点 |
无进展生存(PFS) | 用于评估中期和晚期HCC中的主要治疗方法的II期研究的主要终点。 在中晚期肝癌的Ⅲ期研究中考虑作为联合终点,对优效研究有严格的限制 要求独立集中盲法分析* | |
进展时间(TTP) | 评估中晚期肝癌主要治疗的II期研究的次要(或共同主要)终点。 独立集中盲法分析* | |
无复发生存(RFS)率 | 评估辅助治疗的II/Ⅲ期研究的主要终点 | |
复发时间(TTR) | 评估辅助治疗的II/Ⅲ期研究的主要终点(次要终点) | |
客观缓解率 | II期共同主要终点,Ⅲ期次要终点 用于加速批准的代理终点 早期/中期肝细胞癌的mRECIST独立评估干预盲法回顾性研究。RECIST 1.1和mRECIST均适用于晚期肝癌的治疗评估 | |
患者报告结果(PRO) | 建议作为所有Ⅲ期研究的次要终点,特别是在测试局部或全身治疗时 | |
复合终点 | 可考虑使用OS加PFS | |
选择对照组 | 监测 | 超声检查联合或不联合甲胎蛋白 |
早期肝癌切除或局部消融后的辅助治疗 | 安慰剂 | |
早期非手术治疗 | 射频消融 特别考虑单个大(>4cm肿瘤直径)的治疗标准,根据分期转移原则为TACE | |
中期肝癌 | TACE** | |
晚期肝癌的一线治疗 | 阿替唑珠单抗加贝伐单抗将在批准时予以考虑。索拉非尼或仑伐替尼+支持性治疗 亚洲的其他治疗方法** | |
晚期肝癌的二线治疗 | 瑞戈非尼(仅对索拉非尼耐药的患者)或卡博替尼。雷莫芦单抗仅适用于AFP>400 ng/ml的患者 | |
晚期肝癌的三线治疗 | 安慰剂 | |
随机化前对因素进行分层 | 辅助性 | A)地理区域 B)肿瘤大小和数目 C)治疗类型 D)高危病理因素(大小>3cm,微血管侵犯,分化程度差,肿瘤卫星灶) |
中期 | Child-Pugh分级,AFP>400 ng/ml,地理区域。 可考虑ALBI评分。 已提出根据选择超过7的大肿瘤负荷(采用肝移植适应证扩展标准),但需要验证 | |
晚期一线 | ECOG状态、MVI-EHS、AFP>400 ng/ml和地理区域、病因(在检测索拉非尼时,HCV与其他病毒相比) | |
晚期二线 | ECOG状态、MVI、EHS、地理区域、AFP>400 ng/ml。可考虑进展类型 | |
AFP,α-甲胎蛋白;BCLC:巴塞罗那临床肝癌指南;ECOG:东方肿瘤合作小组;HCC;肝细胞癌;EHS=肝外转移;MVI=大血管侵犯;RECIST:实体瘤反应评价标准。 *=不总是推荐 **=亚洲指南另外的推荐 中期HCC:日本:HAIC;中国:切除术;中国台湾:Y90 晚期肝癌:日本:HAIC/切除/TACE;中国:FOLFOX4,切除/TACE;韩国:TACE |
表2 肝癌研究Ⅲ期试验的预期结果
预期结果 | 早期 | 中期 | 晚期(1线)*** | 晚期(2线) |
总体生存 | TACE:21,26-33个月 | 索拉非尼:~11-14个月 仑伐替尼:~13个月 阿特利珠单抗+贝伐单抗*** | 瑞戈非尼:~11个月 卡博替尼:~10个月 雷莫芦单抗(仅AFP>400 ng/ml):~8个月 | |
PFS | RFS*辅助切除/消融:33个月 | TACE:7个月 | 索拉非尼:~4个月仑伐替尼:~7个月 | 瑞戈非尼:~3个月卡博替尼:~5个月 雷莫芦单抗(仅AFP>400 ng/ml):~3个月 |
ORR* | TACE: ~45-54% | 索拉非尼: ~10% 仑伐替尼: ~24% 阿特利珠单抗+贝伐单抗: 33%; RECIST: 27% | 瑞戈非尼:~10% 卡博替尼:~4% 雷莫芦单抗(仅AFP>400 ng/ml):~5% |
*无复发生存率
**ORR根据mRECIST
***阿特利珠单抗+贝伐单抗有望成为一线治疗,索拉非尼和仑伐替尼将成为二线治疗,见图1
OS期是由患者从随机分组到任何原因死亡之间的时间来定义的。OS期通常被推荐为随机Ⅲ期临床试验的主要研究终点。OS期是监管机构批准药物最常用的终点,因为它是客观的和临床相关的。
在肝细胞癌中,由于大多数患者伴有肝硬化,死亡可能是由竞争性风险引起的,主要是肝毒性和肝功能衰竭。这一事实强调了对该人群进行任何干预都需要进行详细的安全性评估。在早期临床研究和更大规模的随机研究中捕捉不良事件是很重要的。
在Ⅲ期研究中失败的是在HCC人群中比在其他肿瘤类型中毒性更大的新药物。在评估治疗干预的抗肿瘤活性时,肝硬化的竞争风险可能会引入偏差,但通过在肝功能方面实施严格的纳入标准(即无肝失代偿的Child-Pugh评分A)可以很容易地控制。
OS期有一些局限性,比如需要很长的随访时间来捕捉验证实验组显著提高生存率所需的事件数。在探索早期或中期干预措施时,这可能是一个关键限制。
此外,肿瘤进展后患者接受的序贯疗法也会使OS期混淆。例如,在仑伐替尼试验中,30%的患者受影响,在Checkmate 459中,高达50%的患者受影响(比较纳武利尤单抗和索拉非尼)。因此,有必要开发替代终点,它被定义为从临床角度看没有内在意义的结果,但被认为可以准确预测如OS期等刚性结果。
肿瘤学的主要替代终点是PFS期、TTP和客观有效率(ORR)。PFS期是从患者随机化到死亡或影像学肿瘤进展之间的时间,以先发生者为准。利用影像学评估肿瘤反应有不同的工具。在肿瘤学中测量肿瘤反应的最成熟的工具是RECIST标准,最初开发用于评估对细胞毒性药物的反应。这些标准适用于解释改良RECIST(mRECIST)版本中的HCC,该版本将检测到的活肿瘤和动脉增强作为评估疗效的关键组成部分。使用mRECIST标准与标准RECIST相比,增加了达到客观缓解的受试者的百分比。
最近的一项荟萃分析评估了PFS预测晚期肝癌系统治疗Ⅲ期试验OS期的能力。研究发现21个随机对照试验中PFS期和OS期之间存在中度相关性。作者提出PFS期危险比的保守替代阈值<0.6,以预测OS期的临床相关改善。
TTP定义为从患者随机化到影像学肿瘤进展之间的时间。对于纳入试验的患者,每6~8周强制安排一次重复的影像学评估。来自SHARP和后续研究的数据挑战了TTP和OS期之间隐含的相关性。进展类型也可能具有临床意义。
如果患者出现新的肝外病变和/或血管侵犯,而不是现有病变或新的肝内病变的生长导致的肿瘤进展,则生存率更差。最后,ORR是有客观肿瘤缓解的患者百分比,其与OS期的相关性比PFS或TTP差。这部分是由于ORR使用优势比而不是危险比,以及只有一小部分患者达到客观缓解(<25%,对于晚期HCC批准的药物),这是与OS期相关的事件。
尽管如此,据报道,ORR是早期肝癌射频消融治疗、中期肝癌TACE治疗和晚期肝癌TKI治疗的独立生存预测因子。据报道,检查点抑制剂的应答持续时间约为12个月,TKIs的应答持续时间不到6个月,但应答评估尚未适当纳入。同样的道理也适用于肿瘤大小的微小缩小,不能达到客观缓解的标准阈值。在某些情况下,疾病控制的持续时间可能比肿瘤缩小的程度更具有临床意义。
此外,在免疫检查点抑制剂的情况下,与其他分子疗法相比,肿瘤反应的滞后时间更长,甚至可以出现治疗开始后不久的进展(即假进展)。这导致了免疫相关反应标准的发展,该标准要求在首次记录进展性疾病后至少4周确认进展。
食品和药物管理局(FDA)经常使用替代终点来加速批准计划下的药物,该计划最初是为了在HIV流行最严重的年份促进早期获得新的抗病毒药物而开发的。在HCC中,FDA使用ORR和应答持续时间来加速批准免疫检查点抑制剂(CPI)纳武利尤单抗、帕博利珠单抗以及最近的伊匹木单抗和纳武利尤单抗联合用药。加速批准并不具有普遍性,在没有随机第3阶段研究的情况下,监管机构在支持批准的证据强度方面存在一定的主观性。
此外,虽然ORR和其他替代终点的使用可用于支持监管部门的批准,但它们不一定支持纳入指南,因为指南通常遵循更高水平的证据。尽管它们的使用很普遍,但替代终点容易受到解释偏差的影响。除了终点的强度外,关键是要确定新疗法的益处何时真正具有临床意义。这可能会引起争议,这取决于患者、医疗机构、医疗保险公司和监管机构的看法等因素。在HCC中,没有一个设定的阈值来定义临床上有意义的益处,但是一些作者建议将OS率<0.8的危险比临界值作为临床试验设计的起点。事实上,所有HCC的阳性试验都导致HR低于该阈值时生存率的显著差异。
肝癌的监测是推进肝癌管理的里程碑之一,尽管没有确凿的数据直接支持监测人群中癌症相关死亡的减少。每六个月进行一次超声(US)检查,无论是否联合甲胎蛋白(AFP),是目前的标准,建议用于监测任何原因的肝硬化患者或无肝硬化的慢性乙型肝炎患者,超越由肝脏专家协会确定的区域和性别适当的年龄界限。
总的来说,这些计划对所有目标人群的实施是适度的,目前的数据报告,在30%~50%的病例是在监测中发现了肝细胞癌。荟萃分析显示,超声单独应用的敏感性和特异性分别为53%(95%CI:35~70%)和91%(95%CI:86~94%),而超声和AFP联合应用的敏感性为63%(95%CI:48~75%),特异性为85%(95%CI:77~89%)。
由于这种方法检测早期肝癌的敏感性和特异性相对较低,特别是在北美,中心性肥胖的高发生率降低了超声的阳性率,最近的一项研究表明,这种方法导致27%的肝硬化患者经历了后续检查(CT,MRI,肝活检)以鉴别假阳性或不确定的结果。
此外,由于肝癌综合监测策略的实施率较低,北美、欧洲、非洲和亚洲大部分地区(中国台湾和日本除外)60%以上的肝癌患者被诊断为中晚期肝癌。因此,迫切需要更好的、低成本的肝细胞癌监测策略,同时考虑监测策略的利弊是非常重要的。
在上述背景下,还有令人兴奋的时刻,因为在遗传、表观遗传学、蛋白质组学、糖蛋白质组学和代谢组学分析方面的进展使得对肝癌组织、循环肿瘤DNA、血浆和血清的大规模多组学分析成为可能,从而加速了新生物标记物的鉴定。
使用标准生物统计、机器学习和人工智能(AI)方法的模型使用生物标记物结合临床参数来识别肝癌高危人群。正在积极探索的模型和生物标记物包括GALAD(性别、年龄、AFP-L3、AFP和Des-羧基凝血酶原)评分、新糖蛋白(岩藻糖基激肽原)、循环肿瘤DNA差异甲基化区域的液体活组织检查分析和简化MRI成像,建立未来监测验证框架至关重要。
为了指导临床应用的新监测策略的开发和评估,NCI-早期检测研究网络(EDRN)开发了一个5阶段计划,用于使用人类样本(血液或人体组织)以及成像测试的生物标记物。
表3显示了监测试验验证的推荐阶段,包括肝癌监测研究的试验设计。
第1阶段是生物标志物发现或探索性研究。
第2阶段的研究评估了一项检测区分早期肝细胞癌和无肝细胞癌肝硬化的能力。检测年龄、肝病病因和肝功能等混杂因素是很重要的;并且要有足够的样本量和功率。
第3阶段研究招募高危人群,采用前瞻性标本收集、回顾性盲法评估(探针)设计,跟踪他们进行肝癌的临床诊断。目的是评估作为临床诊断前时间的函数,该试验检测临床前肝癌的能力;同时,为第4阶段和第5阶段的研究确定阳性监测试验的标准。
因此,阶段1~3依赖于对存储的数据和标本进行回顾性分析。第4阶段的研究要求新的检测方法应用于临床肝硬化患者,以评估HCC检测的表现以及假阳性率和阴性率。
根据研究中的试验,如果试验已经用于患者医疗(例如,评估用于HCC监测的MRI),则可能跳过第4阶段。第5阶段研究是将新的监测试验与治疗标准进行比较的随机试验,在肝癌的情况下,标准应为超声±甲胎蛋白,目的是确定该试验是否能降低人群的死亡率。
在对肝硬化患者进行监测研究时,重要的是大量的高危人群,以便在合理的时间内获得足够数量的HCC。应考虑老年患者、病毒性肝炎、男性、西班牙裔、糖尿病史和肝癌家族史。另外,已知与肝癌发生相关的独立因素是胆红素异常和血小板计数<100000/mm3。还有必要对目前重要的人群进行研究,如非酒精性脂肪肝相关肝硬化患者、抗病毒治疗后获得持续病毒学应答的丙型肝炎相关肝硬化患者以及抗病毒治疗后乙型肝炎感染受到抑制的患者。
这三个特定人群将是未来十年最重要的病因学危险因素,他们的肝癌发病率(约1%/年)似乎低于以前的高危人群。
因此,在这些人群中进行风险分层的方法对于提高监测策略和方案的有效性将变得越来越重要。REAL-B和PAGE-B评分等模型结合了男性性别、年龄、饮酒、基线肝硬化、糖尿病、血小板计数和AFP,可改善慢性乙型肝炎口服抗病毒治疗患者的风险分层,并有可能纳入监测计划。
在将新生物标志物的性能与当前监测策略进行比较的研究中,一个重要的潜在混杂因素是将超声成像或其他放射学方法纳入标准治疗。如果超声也作为对照组的一部分用于研究,这可能会混淆结果,因为超声本身通常是确定患者是否患有肝癌的金标准过程的一部分。
因此,超声不能看到的HCC患者可能被错误地确定为癌症阴性,而阳性的生物标志物测试被错误地标记为假阳性。
在超声检查作为监测策略的一部分的研究中,使用不同的高精度成像方式(如多期MRI)作为金标准是很重要的。然而,磁共振成像的使用可能会增加大量的研究成本,也可能导致一些小的不确定的假阳性病变的发现,这些病变可以在磁共振成像上看到,并且需要后续检查,这是与监测相关的危害的一个组成部分。
虽然在临床治疗环境中,是否联合AFP的超声表现研究显示,在高危人群中检测HCC的表现并不理想,但尚不清楚2、3或4期生物标志物研究的表现特征是什么,这些研究将满足FDA批准作为监测试验的阈值。
一般来说,FDA关于支持生物标志物鉴定的指南建议,在分析数据之前,应在具有前瞻性回顾性设计的分析计划中规定旨在支持生物标志物鉴定的分析。FDA没有提供一套定量标准来确定生物标志物与临床结果之间的关系,例如在特定的使用背景下诊断HCC。总的来说,体外诊断生物标志物研究的目标是,他们应提供有效的科学证据,证明合理保证产品的安全性和有效性,并保护研究对象的权利和利益。
药物预防领域未满足的主要需求包括:通过使用阿司匹林和其他抗血小板药物、他汀类药物、二甲双胍和类似药物等常用药物进行药物预防,进一步了解降低肝癌风险的可能性。
为了通过药物预防试验建立一个可靠的证据库,需要跨越一些关键的障碍,包括更好地定义目标人群,在使用临床、遗传或其他分子风险分层策略进行随机化之前进行试验富集或分层,以及为基于生物标志物和化学预防试验仔细划定适当的和有临床意义的终点。
纳入药物预防性试验的人群的富集应以合理的事件(HCC发生)终点时间为目标,当然在5年的阈值内。风险人群的分层因素概述如下,是防止失衡的强制性因素。最后,这些试验的瓶颈之一是,最大耐受剂量(3级毒性是不可接受的)可接受的不良事件与晚期肿瘤治疗的不良事件完全不同,在目前接受的晚期肿瘤药物治疗中30%~50%的3-4级不良事件很常见。
编译者简介:
靳勇
苏州大学附属第二医院介入科主任、主任医师、医学博士、博士生导师、中国医师协会介入医师分会全国委员、中国抗癌协会肿瘤消融治疗委员会常委、中国抗癌协会肿瘤介入治疗委员会委员、中国抗癌协会肺癌微创综合治疗委员会副主任委员、科技部创新产业联盟肺癌消融委员会候任主任委员
苏大附二院介入治疗科 平台发布
查看更多