论文部分内容阅读
1.背景与目的
宫颈癌已被列为全球女性第四大常见癌症,其中85%的患者发生在发展中国家。在这些发展中国家,宫颈癌是癌症相关死亡的主要原因。术前明确宫颈癌淋巴结状况对制定治疗计划和预后具有重要意义,而术前影像学检查,包括CT扫描和MRI检查,可能对淋巴结转移有一定的预测价值。
近年来,影像组学受到越来越多的关注,这是一个将医学图像转换成高维度、可挖掘数据的过程。此前的大量研究已经证明,客观和定量的影像组学特征可以被当作一种有效的生物标志物,用来对包括宫颈癌在内的多种癌症病人判断疗效、预测结局等。但是,影像组学技术的最大缺陷在于,当其与常规的机器学习模型配合使用的时候,其准确度始终无法达到满足临床要求的水平。
深度学习(DL)是机器学习以及人工智能的一个亚专业,目前,已被频繁的用到医学诊断,判断疗效,以及判断预后当中。据我们所知,目前还没有研究专门为宫颈癌病人开发出影像组学的深度学习模型,以及在术前预测淋巴结转移情况的相关模型。
因此,我们在这里探讨了建立一个能结合术前影像学和临床病理特征的深度学习影像组学模型的可能性。所建立的模型将有助于识别出无须行子宫切除手术的宫颈癌患者。
2.研究方法
我们从两家学术性医疗机构中收集了2014年12月至2017年11月年间,226例经病理证实的宫颈癌手术患者,并对其进行了回顾性分析。根据2019年FIGO分期系统,所有病例均经组织病理学确诊为ⅠA期至ⅡB期宫颈癌,且未经先期治疗而接受手术的患者。
我们将数据集随机分成训练集(n=176)和独立测试集(n=50)。我们选择了五个影像特征,并建了指纹。然后将这五种影像学特征与术前肿瘤组织学和分级结合起来。为了更好的评估模型,我们首先建立了logistic回归模型。然后我们研究了当今最流行的深度神经网络模型(DNN)。最后,我们在另一个独立的测试集(包括50例宫颈癌手术患者)中验证了深度学习模型的性能。
3.结果
每个病人都抽提了1045个影像组学特征,这些影像组学特征涵盖了强度、形状、纹理、小波、对数转换共5个方面。其中28个影像组学特征与淋巴结状态明显相关(P<0.05),我们从其中选择出C指数最高的5个。
根据这5个特征制作了影像组学指纹(ROC曲线下面积为0.7154,准确度为88.07%)。随后建立的基线水平的logistic回归模型纳入了5个影像组学特征,组织学类型以及级别,ROC曲线下面积达到了0.7372,准确度为89.20%。
最终建立的DNN模型同样纳入了上述7个影像组学和临床特征。经过反复调参,最终建立的深度模型含有4个神经层,每一层的神经元为10个。对于该深度学习模型,使用了Adagrad优化器,并进行了1500次迭代。在内部验证中,模型获得了0.99的ROC曲线下面积,准确度为97.16%。为了排除过拟合现象,又进行了独立的外部验证,在纳入了50例病人的外部验证集中,模型获得了0.90的ROC曲线下面积,准确度为92.00%。
4.结论
本研究通过深度学习技术,构建了一个纳入影像组学特征、组织学类型,以及组织学级别的预测模型。该模型可以很好的在可手术宫颈癌病人中,在术前预测病人是否存在淋巴结转移。
宫颈癌已被列为全球女性第四大常见癌症,其中85%的患者发生在发展中国家。在这些发展中国家,宫颈癌是癌症相关死亡的主要原因。术前明确宫颈癌淋巴结状况对制定治疗计划和预后具有重要意义,而术前影像学检查,包括CT扫描和MRI检查,可能对淋巴结转移有一定的预测价值。
近年来,影像组学受到越来越多的关注,这是一个将医学图像转换成高维度、可挖掘数据的过程。此前的大量研究已经证明,客观和定量的影像组学特征可以被当作一种有效的生物标志物,用来对包括宫颈癌在内的多种癌症病人判断疗效、预测结局等。但是,影像组学技术的最大缺陷在于,当其与常规的机器学习模型配合使用的时候,其准确度始终无法达到满足临床要求的水平。
深度学习(DL)是机器学习以及人工智能的一个亚专业,目前,已被频繁的用到医学诊断,判断疗效,以及判断预后当中。据我们所知,目前还没有研究专门为宫颈癌病人开发出影像组学的深度学习模型,以及在术前预测淋巴结转移情况的相关模型。
因此,我们在这里探讨了建立一个能结合术前影像学和临床病理特征的深度学习影像组学模型的可能性。所建立的模型将有助于识别出无须行子宫切除手术的宫颈癌患者。
2.研究方法
我们从两家学术性医疗机构中收集了2014年12月至2017年11月年间,226例经病理证实的宫颈癌手术患者,并对其进行了回顾性分析。根据2019年FIGO分期系统,所有病例均经组织病理学确诊为ⅠA期至ⅡB期宫颈癌,且未经先期治疗而接受手术的患者。
我们将数据集随机分成训练集(n=176)和独立测试集(n=50)。我们选择了五个影像特征,并建了指纹。然后将这五种影像学特征与术前肿瘤组织学和分级结合起来。为了更好的评估模型,我们首先建立了logistic回归模型。然后我们研究了当今最流行的深度神经网络模型(DNN)。最后,我们在另一个独立的测试集(包括50例宫颈癌手术患者)中验证了深度学习模型的性能。
3.结果
每个病人都抽提了1045个影像组学特征,这些影像组学特征涵盖了强度、形状、纹理、小波、对数转换共5个方面。其中28个影像组学特征与淋巴结状态明显相关(P<0.05),我们从其中选择出C指数最高的5个。
根据这5个特征制作了影像组学指纹(ROC曲线下面积为0.7154,准确度为88.07%)。随后建立的基线水平的logistic回归模型纳入了5个影像组学特征,组织学类型以及级别,ROC曲线下面积达到了0.7372,准确度为89.20%。
最终建立的DNN模型同样纳入了上述7个影像组学和临床特征。经过反复调参,最终建立的深度模型含有4个神经层,每一层的神经元为10个。对于该深度学习模型,使用了Adagrad优化器,并进行了1500次迭代。在内部验证中,模型获得了0.99的ROC曲线下面积,准确度为97.16%。为了排除过拟合现象,又进行了独立的外部验证,在纳入了50例病人的外部验证集中,模型获得了0.90的ROC曲线下面积,准确度为92.00%。
4.结论
本研究通过深度学习技术,构建了一个纳入影像组学特征、组织学类型,以及组织学级别的预测模型。该模型可以很好的在可手术宫颈癌病人中,在术前预测病人是否存在淋巴结转移。