基于小波变换特征提取的卵巢癌代谢组色谱数据分析方法研究

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:banban0802
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:利用代谢组学研究卵巢癌早期诊断生物标志物具有重要意义,对此目前主要是通过分析代谢组质谱数据筛选生物标志物。本研究则是通过卵巢癌代谢组色谱数据分析,充分利用时间序列自相关信息,提供重要的低浓度代谢物信息及其保留时间的位置,并对质谱数据进行定位,有针对性地对某一段保留时间的质谱数据进行分析,筛选出具有卵巢癌特异性的潜在生物标志物。  内容:代谢组数据不能直接提供显性的生物学知识,需要运用各种信息处理技术和统计学方法,从数据中提取有用的信息。本项目设计将色谱图转换成二维连续小波系数图像进行分析,即通过特定的小波基函数将卵巢癌患者与正常对照样品的色谱图转换成二维小波系数图像,通过色谱图像的研究获得预处理信息,再结合质谱数据进行分析,以获得更多更丰富的生物信息。研究的具体内容包括:小波基及参数的选择、小波多尺度变换、小波系数图像转换算法、小波纹理特征提取算法、图像锐化特征提取算法。最后要重点分析卵巢癌代谢组数据,获得难以单纯用质谱数据分析得到的低浓度生物标志物信息。  方法:通过连续小波变换,获得小波尺度系数矩阵,首先采用一维小波分析方法,研究其有效性;进而,将色谱数据类型转换为具有位置特征的二维图像,通过不同子矩阵分割,采用三种不同特征提取方法获得特征向量;再通过设置不同的参数构造不同的Gabor小波变换滤波器,以及五种增强图像边缘和轮廓的锐化方法,实现图像纹理特征提取。模式识别及特征筛选采用随机森林(RF)方法。上述方法的有效性通过卵巢癌数据分析进行验证,结果的生物学解释利用HMDB、Melin和KEGG代谢组生物功能数据库查询。程序编写使用Matlab和R语言。  结果:主要结果如下:  ●通过一维离散小波与连续小波变换获得色谱数据新的特征,能够提高数据的分类效果。离散小波变换后分类效果优于原始色谱数据,同一小波基的连续小波变换优于离散变换,不同尺度的连续小波变换有不同的分类效果。利用Mexh小波函数对色谱峰数据进行不同尺度小波变换能够提取色谱峰不同的重要特征。  ●应用Gabor小波滤波器对卵巢癌色谱小波系数图像特征提取,采用RF模式识别和交叉验证方法验证,比原始数据的分类效果有明显提高。分类效果和提取的特征与滤波器参数选择有关,当参数设置不同的频率和方向时,筛选出的特征不同,因此可以通过改变参数的方法为后续的质谱数据分析提供不同的位置信息。  ●将卵巢癌代谢组色谱数据进行Mexh小波基函数二维多尺度变换,获得小波系数图像。通过水平垂直差分法计算图像的梯度值,并结合5种不同的图像像素值输出方法,从不同的角度增强图像某个边缘以及轮廓特征。图像锐化后分类判别效果要优于原始色谱数据的结果,而且能够表现图像不同的边缘及轮廓,提取不同的特征。  ●利用Mexh小波基函数对卵巢癌代谢组色谱数据进行二维多尺度变换,获得小波系数矩阵。以10×8为子矩阵对每一样品系数进行分割而获得新的特征向量。用RF模型筛选特征,按照筛选的特征位置进行定位,最后对这一段保留时间内的质谱数据进行重点分析,筛选出20种卵巢癌的低浓度潜在生物标志物,推测出8种代谢物质的化学结构,其中经过标准品验证确定了2-哌啶酮这一新发现的卵巢癌生物标志物。  ●应用Gabor滤波器对卵巢癌代谢组小波系数图像提取纹理特征,用RF模型筛选分类能力较强的特征。通过保留时间对质谱数据定位,筛选出了与上一种方法不一样的生物标志物,推测出8种代谢物质的化学结构。  ●应用图像锐化的方法对子宫肌瘤与卵巢癌色谱数据提取小波系数图像特征。通过对质谱数据定位,筛选出20种潜在生物标志物,推测出6种代谢物质的化学结构。  结论:基于小波变换的代谢组特征提取方法不但能够提高数据的分类能力,而且能够提取色谱数据的不同特征,为常规的质谱数据分析提供重要的信息。
其他文献
随着课堂教育教学改革的深入,新课程改革的深化,语文学科也责无旁贷。如何培养学生自主阅读、主动思考、乐于探求的学习习惯?如何打造高效课堂?如何培养学生大语文观?是我们一线语
摘要:构建适应新课程改革的课堂教学模式,强力打造高效课堂,切实提高课堂效率势在必行。基于此,我们学校站在课堂改革的前沿,遵循教育教学规律和学生的认知规律,摸索出了大幅提升教育教学质量的课堂教学模式:四环节课堂教学模式。我们学校在高效课堂上进行了大胆的探索,形成了独具特色的限时高效素质课堂模式。素质教育呼唤高效课堂,高效课堂呼唤有效教学模式。高效课堂是有效课堂的最高境界,高效课堂基于高效教学模式。教
摘 要:组织液与淋巴间的关系,是内环境组成成分之间相互关系的难点内容。然而教材内容对此的讲述简洁概括,特别是其中的两幅插图更是容易引起学生对此产生误解,造成学生认知困惑。笔者认为要解决学生对此问题的疑惑,需从淋巴生成机理以及淋巴管道系统结构两方面着手,解决三个问题:①淋巴液可否逆流回到组织液?②淋巴液能否和组织液进行物质交换?③淋巴循环有何的生理意义何在?这也启示教师需不断提升自身专业素养,在备课
本刊今年第9期《争鸣园地》栏目曾以比较显著的位置刊登了作者武夷的文章《旋风中的困惑与沉思——对省级卫视大“变脸”的几点质疑》。该文谨就全国省级卫视纷纷改版的现象
摘要:随着经济社会的不断发展,不同类型的工作对于人才的要求越来越高,人才与技能之间出现知识、技能与实际训练之间的空白和需求,因此,继续教育为经济发展的时代提供了专业人才的有效培养方式,继续教育能够补充实现知识与技能之间的空白,继续教育的发展在经济发展的知识时代占据着至关重要的作用。因此,强化中职学生的继续教育的教育质量对于增加中职学生的知识储备量和提高学生的工作效率有着至关重要的作用。  关键词:
摘要:根据制造类专业建设及课程建设思路,结合高职学生的特点,在如何提高人才培养规格,由一般的技能型向技术技能型提升,推动教学思路及教学方法的创新。本文以《UG NX三维产品设计》课程为例,探讨在高职课程开展高端三维软件教学的方法。结合案例教学法的应用特点,论述案例教学法在《UGNX三维产品设计》课程中的应用。  关键词:案例教学法;三维产品设计;UGNX ;模块设计  ·F230-4  引言:UG
摘要:保险业务知识是中职《金融基础知识》课程中的重要内容。由于缺少与实际业务接触带来对概念的不易理解是实际教学中存在的主要问题。根据学生在生活中经常出现的现象与问题设计生活化的教学情景会收到良好的教学效果,达到知识与生活、社会融会贯通的目的。  关键词:金融;中职生;保险业务;教学设计  中国分类号:F83  《金融基础知识》是中等职业学校电子商务、会计专业的一门主干专业基础课程和必修课程。根据中
摘 要:兴趣是求知的起点,是思维培养、能力提高的内在动力.在中学数学学习的过程中,学习兴趣的培养,对学生数学学习至关重要,是学好数学的重要前提条件,也是新课改的基本要求,其思想应用比较普遍.  关键词:中学数学;兴趣培养  中国分类号:G633.6  数学作为中学一门最基本的课程,是学好其他学科的必备基础,它几乎伴随着一个学生的整个学习生涯,其重要性不言而喻.数学也是一门较为抽象的课程,这表现在基
摘要:通过写作与生活结合,写作与阅读结合,活动激趣,赏识讲评,体验成功等方式的激发,学生的写作积极性空前高涨,过去那种令人心烦的写作课已然不再。  关键词:作文教学 写作兴趣 观察  中国分类号:G633.34  “兴趣是最好的老师。”让学生愉快学习,饶有兴致地轻轻松松地作文,是实施语文素质教育的理想境界,也是新课程改革的探索之路。那么,如何激发学生的作文兴趣呢?  一、 美文美读,激发兴趣  当