预测HR+/HER2−早期乳腺癌复发风险:新型预后模型的构建与性能验证

Wait 5 sec.

HERPAI模型在HR+/HER2−早期乳腺癌患者风险分层及辅助治疗决策中展现潜力。乳腺癌是全球女性中最常见的恶性肿瘤之一[1],其中激素受体阳性/人表皮生长因子受体阴性(HR+/HER2−)亚型占大多数[2]。尽管辅助内分泌治疗(ET)极大地改善了I-II期HR+/HER2-乳腺癌患者的预后,但其20年远处复发率仍超过10%[3]。此外,尽管CDK4/6抑制剂(CDK4/6i)强化内分泌治疗已被证实可改善II-III期HR+/HER2−乳腺癌患者的无浸润性疾病生存期(iDFS)[4-6],但研究结论尚存在争议。目前已有多种针对HR+/HER2−患者的预后及预测模型被提出并验证,然而这些模型多基于I-III期全体患者构建,可能不适用于早期阶段患者。此外,这些模型主要采用远处复发和总生存期(OS)作为主要终点,而早期患者此类事件发生率较低,可能限制其在新辅助治疗场景中的临床应用。针对此,近期发表在Scientific Reports杂志的一项研究中[7],研究者基于Transformer开发了深度学习预后模型HERPAI,旨在利用临床和病理预测因子预测患者iDFS。本文特此整理关键内容,供读者参考。图1 研究标题研究设计与方法▌研究样本本研究为回顾性队列研究,纳入2012年1月1日至2023年12月31日期间在四家独立医学中心接受根治性手术并依据第8版AJCC指南病理诊断为T1-2N0-1M0分期的HR+乳腺癌女性患者。排除标准包括:HER2+患者;存在多发病灶且无法获取免疫组化(IHC)结果;HR-/HER2+患者;术前接受过任何抗肿瘤治疗者;合并其他恶性肿瘤(定义为确诊时间不足5年)者;术后30天内死亡者。总体研究设计如图2所示。图2 研究流程图(A)本研究中使用的预测因子、结果和方法(B)研究工作流程▌研究终点预后模型的主要终点为iDFS,依据标准化疗效终点定义(STEEP)系统界定。次要终点包括远处无病生存期(DDFS)和OS。随访时间从手术完成开始,至死亡、失访或研究截止日期(2024年3月31日)终止,以先发生者为准。▌候选预测因子候选预测因子主要基于临床实践与既往文献筛选,临床变量包括年龄、BMI、绝经状态、家族史、乳腺手术方式及淋巴结手术方式。病理变量涵盖组织学类型、组织学分级、雌激素受体(ER)表达状态、孕激素受体(PR)表达状态、HER2表达状态、Ki67表达状态、病理T分期及N分期等。具体因素见表1。▌统计分析及模型验证连续变量以均值[标准差(SD)]或中位数[四分位距(IQR)]描述,分类变量以频数及百分比表示。以中心1患者作为衍生队列,随机分为训练集(90%)与内部验证集(10%),外部验证集来自其余三家医学中心。HERPAI深度学习模型基于FT-Transformer架构开发,采用五折交叉验证策略在训练集与内部验证集构建模型,并于内部及外部验证集评估性能。同时构建Cox回归模型与XGBoost模型作为对照。模型性能评估指标包括:总体人群及预设亚组(按绝经状态、淋巴结受累状态、分级、Ki67表达、辅助化疗/放疗接受情况分层)的C-index;3年与5年时依时间依赖的受试者工作特征曲线下面积(AUC);校准曲线评估预测一致性;决策曲线分析(DCA)评价临床效用。对Cox回归与XGBoost模型进行相同评估。研究关键结果▌患者基线特征衍生队列和外部测试队列分别纳入5424例和916例患者,基线特征见表1。衍生队列中4882例(90%)用于模型开发(中位年龄57岁,IQR,47-66),其中3319例(68.0%)为T1期,3740例(76.6%)为N0期;542例(10%)用于内部验证(中位年龄57岁,IQR,47-66),其中367例(67.7%)为T1期,402例(74.2%)为N0期。外部测试队列来自另外三家中心(中位年龄52岁,IQR,45-62岁),其中604例(65.9%)为T1期,656例(71.6%)为N0期。中位随访时间分别为58.6个月(IQR,30.8-94.5)、56.1个月(IQR,29.5-92.3)和53.2个月(IQR,38.0-73.5),训练集/验证集、内部测试集和外部测试集分别观察到305例、32例和78例iDFS事件。表1 患者基线特征▌模型性能评估HERPAI模型在验证集、内部测试集和外部测试集的C-index分别为0.73(95%Cl,0.65–0.81)、0.73(95%Cl,0.62–0.85)和0.68(95%Cl,0.60–0.77)(图3A)。5年iDFS的AUC值分别为0.75(95%Cl,0.56–0.93)、0.75(95%Cl,0.43–1.00)和0.71(95%Cl,0.47–0.94)(图3B)。所有队列中,HERPAI均表现出良好的校准度,临床决策曲线(DCA)大部分区域位于“全治疗”与“不治疗”曲线之上,提示模型具有理想的获益平衡。图3 验证、内部测试和外部测试队列中的模型性能预设关键亚组分析显示模型一致性良好。在外部测试队列中:淋巴结转移阳性与阴性患者的C-index分别为0.69(95%Cl,0.52-0.86)和0.68(95%Cl,0.55-0.81);接受或未接受辅助化疗亚组分别为0.69(95%Cl,0.59-0.78)和0.67(95%Cl,0.41-0.93);接受或未接受放疗亚组为0.67(95%Cl,0.53-0.82)和0.69(95%Cl,0.59-0.78)。此外,与Cox回归模型、XGBoost模型及其他已知风险因素(如年龄、T分期、N分期、Ki67表达)相比,HERPAI模型的预测效能更优。外部测试集中,HERPAI模型对DDFS和OS的预测C-index分别为0.68(95%Cl,0.49–0.86)和0.71(95%Cl,0.47–0.94)。校正化疗/放疗后,HERPAI评分仍与iDFS显著相关。在2795例(51.5%)有基因数据的患者中,HERPAI评分较复发评分(RS)更具预测效力(C-index=0.620,95%Cl,0.577–0.662),且绝经后女性(C-index=0.594,95%Cl,0.540–0.648)及ER表达