基于随机森林的电离辐射诱导DNA双链断裂分类模型的构建与应用

来源 :中华放射医学与防护杂志 | 被引量 : 0次 | 上传用户:zua263net
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的

构建预测电离辐射诱导DNA双链断裂(DSB)水平的随机森林分类模型,初步研究DSB在基因组中的分布规律。

方法

将GRCh38参考基因组分为50 kb的片段,根据MCF-7细胞的测序数据把片段分为电离辐射诱导的DSB低水平和高水平区域,以8种表观遗传学特征作为输入,随机将数据集的2/3列为训练集,1/3列为测试集,构建含100棵决策树的随机森林分类模型。分析分类模型中表观遗传学的特征重要性,展示这些标记在不同DSB水平区域的富集差异。

结果

随机森林分类模型在测试集上预测的准确率为99.4%,精准率为98.9%,召回率为99.9%,受试者操作特征曲线下面积为0.994。8个特征中H3K36me3和DNase标记的重要性最高,富集分析表明DSB高水平区域的这两类标记明显高于DSB低水平区域。

结论

以表观遗传学数据作为特征输入,随机森林分类模型可在50 kb基因组区域上准确预测电离辐射诱导的DSB水平,分析表明这些DSB可能主要分布在基因组中转录活跃的部位。

其他文献
期刊
目的分析放疗前预后营养指数(PNI)对临床Ⅲ期食管癌患者生存预后的影响。方法回顾性分析2013年至2017年河北医科大学第四医院125例临床Ⅲ期接受根治性放疗的食管癌患者,计算PNI、营养风险指数(NRI)等营养指标,采用受试者工作特征曲线(ROC)确定PNI最佳临界值为49.925,依此预后营养指数将患者分为低PNI组(PNI<49.925)和高PNI组(PNI≥49.925),NRI以100作
目的研究X射线对人脐静脉内皮细胞(HUVEC)中缝隙连接蛋白43(Cx43)的表达、分布和细胞刚性的影响,初步探讨Cx43对受照细胞刚性的调控作用。方法采用Western blot方法检测10 Gy X射线照射后不同时间(0、6、12、24和48 h)和不同剂量X射线(0、2.5、5、10和20 Gy)照射后12 h HUVEC细胞中Cx43表达水平的改变,以及不同剂量(0、5和10 Gy)X射线
目的研究核酸内切酶RNaseH-1对使用端粒的替代延长(ALT)机制来延长端粒的骨肉瘤细胞放射敏感性影响及机制。方法通过慢病毒转染构建过表达RNaseH-1的ALT骨肉瘤细胞U2OS和端粒酶阳性骨肉瘤细胞143B。对转染后的细胞使用CCK8法检测细胞增殖能力,流式细胞仪检测细胞周期。克隆形成实验检测放射敏感性,免疫荧光实验检测细胞DNA损伤(γ-H2AX灶点)情况,蛋白印迹法实验检测相关蛋白表达水
目的通过对放疗疗程中不同时段CBCT图像的影像组学分析,寻找早期定量预测食管癌放疗放射性肺炎(RP)的参数,结合临床特征和肺剂量体积参数建立联合Nomogram模型并探讨这一模型对食管癌RP的预测价值。方法回顾分析2017—2019年间临床资料、剂量学参数、CBCT图像资料完整的96例胸中段食管鳞癌调强放疗患者资料,每例患者均分别获取放疗期间3个不同时段的肺CBCT图像。全组病例随机分成训练集(6
目的 本试验旨在研究临床经常使用的4种不同分析原理POCT血糖仪的性能验证评价,同时与本院生化分析仪血糖检测结果进行比对分析,评价其结果的一致性,为医院临床使用POCT血糖
Background::More and more scholars have called for the cumulative live birth rate (CLBR) of a complete ovarian stimulation cycle as a key indicator for assisted
目的 对砷铈催化分光光度法测定尿碘进行不确定度评定.方法 采用WS/T 107.1-2016方法测定尿中碘,确定不确定度的来源,量化样品测量过程中的不确定度.结果 使用该法测定尿碘浓
期刊
目的 探讨64排螺旋CT后处理技术在肝硬化及肝癌疾病诊断中的临床价值.方法 本次研究一共纳入185例患者为研究对象,均为2018年1月至2020年12月在我院诊治的肝硬化及肝癌患者,