一、整体感知
1.题目要素拆解
从文章题目中我们可以得到的信息:
1)预测变量:临床影像组学列线图
2)结局:黏膜愈合(MH)
3)研究对象:英夫利昔单抗(infliximab,IFX)治疗的克罗恩病(CD)患者
2.文章基本信息
杂志 |
European Radiology |
分区 |
2区 |
IF2022 |
7.034 |
发表时间 |
2022.07.20 |
研究对象( P):确诊为克罗恩病的患者(n = 106)
预后模型( I/C): Logistic回归模型构建的影像组学signature;
结局指标( O):黏膜愈合(MH);
研究类型( S):回顾性队列研究,预后预测类型;
研究目的:开发基于CTE的影像组学特征,用于无创性预测克罗恩病(CD)患者的黏膜愈合(MH)模型
4.变量分析
预测变量( X):影像组学signature
结局变量(Y): MH
协变量( Z):
人口学:年龄、性别、病程;
分型:蒙特利尔分型-病变部位(回肠型(L1)、结肠型(L2)、回结肠型(L3));
蒙特利尔分型-疾病行为(非狭窄、非穿透(B1);狭窄(B2);穿透(B3);肛周病变(P));
既往史:确诊时吸烟情况、既往腹部大手术;
辅助检查:C反应蛋白水平、血沉、血清白蛋白水平、白细胞计数、Harvey-Bradshaw指数(HBI)、克罗恩病的简单内窥镜评分(SES-CD);
用药史:既往使用类固醇或免疫调节剂。
5.研究背景
临床问题:克罗恩病是一种慢性复发性疾病,可导致多种并发症;抗肿瘤坏死因子(TNF)靶向药,例如IFX,可有效诱导CD患者实现临床缓解和黏膜愈合(MH);MH是CD实现长期无糖皮质激素临床缓解的预测指标,早期预测MH对于 临床医生评估预后并选择合适的个性化治疗方案有重要意义。
目前方法不足:目前已有研究 CD患者经IFX治疗后MH与钙结合蛋白及C反应蛋白水平之间的关系;然而,在抗TNF治疗前能够早期预测MH仍有待研究。
研究GAP:既往“CD+影像组学”多用于评估CD的肠道纤维化以及将CD和肠结核鉴别,本文是第一篇在IFX治疗前早期预测CD患者的MH的预后类型的影像组学研究。
本文解决方式:基于此,作者联合CTE影像组学特征和患者临床特征构建MH预测模型,并建立了初治CD患者的临床影像组学列线图,以期为临床诊治决策提供参考。
二、模型构建
1.workflow展示
Figure 1
Figure 2
让我们先来看一下流程图,Figure 1展示了整体的研究技术路线;Figure 2为影像组学部分的流程,重点来看一下,主要有如下几部分:
① 获取CT影像
② VOI分割
③ 特征选择
④ 模型构建与评价
2.纳入排除标准建立
第一部分
文章方法部分解读
纳入标准
① 经临床、影像学、结肠镜检查和组织学评估诊断为CD;
② 在IFX治疗前3个月内进行结肠镜检查和CTE检查;
③ 以前没有接受过抗TNF药物治疗;
④ 以结肠和回肠末端病变为主;
⑤ 没有活动性感染性病变(包括腹腔脓肿和肛周脓肿),以及最近没有严重或机会性感染的病史。
排除标准
① 在IFX治疗后26周未行结肠镜检查;
② 未行标准化IFX治疗;
③ 有结肠切除史;
④ CTE图像质量差。
第二部分
PICOS原则梳理
P:
年龄:不限制;
性别:不限制;
疾病状态:首诊初治;
治疗方案:IFX治疗, 分别于0、2、6周静脉注射IFX 5 mg/kg,之后每8周静脉注射1次;
诊断标准: 经临床、影像学、结肠镜检查和组织学评估证实。
I/C:
影像设备:CTE(Optima CT680和Revolution CT);
扫描方式:轴向;
靶区:有明显溃疡的炎症性肠段;
影像检查时间点:IFX治疗前;
扫描参数:管电压120kV;管电流150-300mA;层厚5mm;层间距5mm;(两台仪器设定参数相同)
造影剂: 造影剂(320 mg/ml),剂量1.5mL/kg, 以3.0mL/s的速度向外周静脉注射。
O:
远期疗效:MH
第三部分
纳排及分组结果
最终,共纳入106名患者, 入选患者按照7:3的比例被随机分为训练集(n=73)和测试集(n=33)。
如图,Table 1列出了训练集和验证集的患者基线资料表
可以看到,作者分别对于训练集和验证集的患者分别进行了显著性检验,除了病程在训练集和验证集均p<0.1,其他协变量均无显著性差异。对于为何选择p<0.1,我们后文解释。
3.图像分割
分割过程由两位具有5年以上腹部影像诊断经验的影像科医师执行,使用ITK-SNAP(version 3.6, www.itksnap.org/ )软件对每个病变进行3D分割。
文中根据以下标准为每个患者的活动性炎性肠段选择感兴趣体积(VOI):
① 炎性肠段内窥镜检查有明显溃疡;
② 肠壁增厚和高强化;
③ 有炎性穿透并发症(无脓肿)的肠壁;
④ VOI的范围包括病变的肠壁,但不包括CTE图像上的管腔。
小注:ITK-SNAP软件是一个用于三维医学图像分割的软件应用程序,由宾夕法尼亚大学宾州图像计算与科学实验室(PICSL)的Paul Yushkevich博士和犹他大学科学计算与成像研究所(SCI)的Guido Gerig博士合作开发。
3D分割过程展示如补充材料图1,(a,d) CD患者中MH和非MH患者的CTE肠相图;(b、e) 逐层勾画病变;(c,f)病变的3D ROI。
4.特征提取(及数据预处理)
- 数据预处理
处理方法:对从两台不同参数的CT扫描仪上提取的特征值进行z-score 标准化处理
- 特征提取
工具:PHIgo 工作站 (GE Healthcare China).
特征类型 +提取结果:
最终,从基于CTE的图像中从感兴趣区中提取了1595个放射组学特征。
小注:PHIgo工作站是一种适用于多模式医学影像技术图像智能化阅读、处理和进行高层次科研的工作站,能够对来自于不同模式医学系统的多种图像格式进行智能化处理。
5.特征选择
使用IPM 统计软件 (version 2.4.0, GE Healthcare)进行数据预处理和特征选择;
文中共分为三步:
① 随机选择30组CT影像进行2次分割,利用组内相关系数ICC评估提取特征的可重复性,ICC>0.75的影像组学特征被保留;
② 对训练集中MH组和非MH组进行单因素Logistic分析,筛选出有统计学意义的特征,至此得到175个影像组学特征;
③ 第三,使用梯度提升迭代决策树(GBDT)算法和多变量Logistic分析来选择最有价值的特征,最终得到5个特征。
小注:梯度提升迭代决策树(GBDT)算法:是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来得到最终答案,是集成学习中boosting的一种。总体思路是利用每个弱学习器计算当前输出与真实值的残差,然后将每个学习器输出的残差进行累加,以求接近真实值。
Rad-score中的各特征和权重展示如下:
6.模型建立
- 临床模型建立
首先采用单因素分析比较两组患者临床特征的差异,有显著意义的变量(p<0.1)进一步纳入多因素回归分析(病程),采用多因素Logistic回归分析(p<0.05)和方差膨胀因子(VIF)建立临床模型。
多因素回归分析中病程(odds ratio (OR) = 0.969, 95% confidence interval (CI) = 0.943–0.995, p = 0.021),是临床模型中MH的独立预后因素。
小注:为何作者这里设置单因素分析p<0.1而不是我们常用的0.05?
在统计分析中,以P<0.1作为构建临床模型的单变量分析的分界点的显著变量也是常见的。它允许更多的临床因素被纳入多变量逻辑回归分析中(P<0.05),并有可能产生更多的独立临床因素。
在此文中,训练集和验证集中只有病程均满足p<0.1(训练集中病程p=0.014,验证集中病程p=0.084),所以作者为了纳入此变量构建临床模型放宽p值。
- 临床影像组学列线图建立
作者随后 基于训练集,结合Rad-Score和病程构建临床影像组学融合模型的列线图,如图3所示;经多因素Logistic回归分析计算出临床影像组学列线图评分(Nomo-score),如下:
Nomo-score=-1.3356+(1.0455×Rad-score )-(0.0217×disease-duration )
Figure 3 临床影像组学列线图
三、模型评价
1.预后模型的评价
补充资料里展示了对于影像组学模型的预测能力评价:
Figure S2影像组学特征在训练集中的表现: (a)ROC曲线;(b)影像组学特征的校准曲线;(C)每个患者的影像组学评分;(D)DCA决策曲线分析
结果显示:
图a ROC曲线在训练集中AUC为0.846 (95% CI: 0.759–0.921),具有较好的预测性能;
图b校准曲线显示模型在训练集的拟合效果较好;
图c每个患者的影像组学评分,图片中没有给出图例,姑且我们默认蓝色条带代表达到MH的患者,红色条带代表非MH的患者,纵坐标代表评分,正值即为影像组学判断为MH的患者,负值为影像组学判断为非MH的患者。读图可知,在影像组学预测的非MH换这种,有3个预测错误;在MH患者中,有13个预测错误,由此可以得到训练集的敏感度0.84和特异度0.729,和后文table3列出的相对应;
图d DCA决策曲线显示影像组学模型在训练集中可以产生临床获益。
Figure S3影像组学特征在测试集中的表现:(a)ROC曲线;(b)影像组学特征的校准曲线;(C)每个患者的影像组学评分;(D)DCA决策曲线分析
结果显示:
图a ROC曲线在训练集中AUC为0.817 (95% CI: 0.665–0.945) ,同样具有较好的预测性能;
图b校准曲线显示模型在验证集的拟合效果较好;
图c每个患者的影像组学评分在影像组学预测的非MH患者中,有3个预测错误;在MH患者中,有6个预测错误,同样由此可以得到验证集的敏感度和特异度,细心的同学如果真的自己动笔算了会发现,数值和文中table3给出的数值是对不上的,我们给出的敏感度0.75,特异度0.714,文章在这里存在一个bug。
图d DCA决策曲线显示影像组学模型在验证集中可以产生临床获益。
2.预测模型的评价
1. Figure 4展示了临床影像组学融合模型列线图的评价:
Figure 4 a校准曲线;b决策曲线分析
结果显示:
临床影像组学列线图的校准曲线和DCA分析均显示出良好的校准;
2. Table 2展示了三种模型在训练集和测试集中的表现
结果显示:
在三种模型中,临床影像组学融合模型列线图的AUC值最高,分别在训练集为0.880(95%CI:0.809-0.943),测试集为0.877(95%CI:0.745-0.983),显示出较好的预测性能。
3. Figure 5展示了种三模型的ROC曲线和DCA分析曲线
Figure 5三种模型的ROC曲线和DCA曲线。a训练集中三个模型的ROC曲线;b测试集中三个模型的ROC曲线;c训练集中三个模型的DCA曲线;d测试集中三个模型的DCA曲线。
结果显示:
在DCA分析中,合理的阈值概率内的大多数训练集和测试集,与临床模型和影像组学模型相比,临床影像组学列线图在区分MH和非MH组方面显示出更大的总体净收益。
四、全文总结
本文构建了基于CTE的影像组学特征,来预测CD患者在IFX治疗后26周的MH,并评估了临床模型、影像组学模型以及临床影像组学列线图的预测性能。
全文分析下来大家可以感知到这篇文章的工作量并不大,是什么原因让它发到欧放杂志的呢?
首先,这篇文章的创新点和出发点很好,作者列举了往期研究均在IFX治疗后预测MH,而将MH的预测提前到IFX治疗前将是一个重大的进步,基于此作者创作本文;
其次,文章构建了临床和影像学融合模型列线图,并对临床模型、影像组学模型以及融合模型均进行了评价,论证比较完善;
最后,影像组学套路应有的步骤,文章基本都具备了,内容比较完整。
再来看看本文的局限性:
① 在治疗前的结肠镜检查中,每个患者都被勾画出有着活动性炎症和明确溃疡的3D病变,需要进一步研究溃疡病变肠段与所有病变肠段在表现上的差异;
② 考虑到结肠不同程度的扩张和拉伸,三维形态模型对病变提取的影响有待进一步研究;
③ 目前克罗恩病的简单内窥镜评分(SES-CD)被用于评估结肠和回肠末端病变患者的MH,评估小肠MH尚无公认的参考标准。因此本文纳入患者也局限于结肠和回肠末端病变,进一步的研究应集中于病变在小肠的MH;
④ 样本量较小,仅有106例,属于回顾性研究,因此作者希望接下来开展一项大样本量的多中心前瞻性研究。不过对于CD这个疾病,相对于癌种,样本量也不算很小啦。
看到这里,相信小伙伴们对于影像组学的文献更加熟悉了吧!经过一番拆解,套路就摆在这里,这篇国人的文章可以发到欧放杂志,大家是不是也跃跃欲试了呢?
这就是克罗恩病+影像组学擦出的奇妙火花,如果换一个其他常见病,大概率是发不到欧放的。
鑫仔说
我们的文献解读范围也逐渐从肿瘤拓展到非肿瘤,与生信研究类似,相同质量的非肿瘤研究肯定是要比肿瘤研究发的好一些的。
本文的最大问题有两个,首先,数据展示并不到位,无法获取作者提取了什么特征,每步特征选择结果也比较含糊不清。
其次,在测试集混淆矩阵部分的计算出现了错误,欧放文章出现这样的失误是不应该的。
不过反过来讲,非肿瘤结合一个好的临床问题,100例左右的病例,单模态+单靶标的影像组学研究,即使犯一些小错误,2022年是完全可以达到欧放水平的,从另一层面增加了大家的信心。
好啦,本期的文献分享到这里,对于追求2区的小伙伴是不是又一次的冲击呢?继续跟紧君莲数据库的平鑫而论专栏,我们下期见吧~~
参考文献:
— END—
撰文 丨小 园 梓
审核丨鑫仔老师
责编丨小张老师
往期推荐 返回搜狐,查看更多
责任编辑: