基于SAM的基因表达谱数据分析方法研究及应用

来源 :第四军医大学 | 被引量 : 13次 | 上传用户:wangzhanglu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微阵列技术可同时获得大量基因的表达谱,已广泛应用于生物医学研究。基因表达谱数据具有高维和样本量小的特点,如何挖掘其中所蕴含的海量基因信息,深层次研究基因功能,已成为微阵列技术发展和应用的瓶颈。目前,基因表达谱数据分析方法的研究已成为生物与医学统计学研究领域的重要任务和热点问题。本文研究基于SAM的基因表达谱数据分析方法,围绕筛选差异表达基因、控制多重检验错误率和微阵列实验样本量估计中的若干生物统计学问题展开初步的研究。本研究主要作了以下工作:  1.简要介绍了微阵列实验设计方法、数据预处理和标准化方法。广泛复习和回顾了基因表达谱数据筛选差异表达基因的统计方法和控制多重检验错误率的方法。  2.根据微阵列研究统计设计和数据资料类型,分别引入解释变量为计量变量、分组变量为两分类或多分类变量,以及数据资料为重复测量设计和生存分析资料时,筛选差异表达基因的SAM方法;给出了permutation算法计算FDR的方法;介绍了用于呈现微阵列研究差异表达基因的统计图表。当微阵列研究分组变量为多分类变量时,针对多组间多重比较中效应量(标准均数差)计算问题进行了深入研究。  3.探讨了pFDR的Bayes解释和q值的解释,给出了固定拒绝域估计pFDR、FDR和q值的算法;对评价一组假设检验显著性的统计量尾强度(TS)进行研究,探讨了TS的专业解释,并给出了TS与FDR的关系。  4.假定power1?=FDRβ=,FNR=α,给出了一种简单的适用于多种设计类型的微阵列研究样本量估计方法。  5.采用模拟数据比较了SAM方法、Bonferroni校正法、BH法等6种基因表达谱数据筛选差异表达基因的方法,探讨了各种方法的筛选效果。结果发现:Bonferroni校正法、Sidak校正法、Hochberg法和成组t检验方法不适用于基因表达谱筛选差异表达基因的数据分析;SAM方法和BH法筛选差异表达基因数、假阳性数、FWER和FDR均相差不大,均筛选出较多的差异表达基因,且控制了多重检验错误率,适用于基因表达谱数据筛选差异表达基因的数据分析。  6.对4种常见基因表达谱数据进行实例研究,筛选组间差异表达基因,计算了FDR、q值、TS等统计量,并给出专业解释;采用某微阵列预实验数据,按照本文给出的样本量估计方法,估计微阵列研究所需样本量。
其他文献
《小学语文课程标准》中指出:“阅读教学的重点是培养学生具有感受、理解、欣赏和评价的能力。”阅读与写作是语文学科中的主体内容,阅读是写作的基础和借鉴,写作是阅读的升华和
期刊
如何解读和定位棉棉,将有助于了解消费时代中国的亚文化写作电梯键上有一个大大的X。所有的人都说上海是未来,未来里有什么?答案就像这个从一楼迅速闪到54楼的X。——《熊猫
戒烟不是件容易的事,如果做不到一口不抽,那就尽量抽得越少越好.因为美国医师协会近期发表的一篇有关吸烟频率对健康影响的研究表明,每个月吸烟超过6根,死亡风险就会增加.
期刊
课程审议是指课程开发主体反复权衡讨论教育实践中存在的问题,以得到一致解释与理解,以便做出恰当的课程变革决策,简而言之是利用集体智慧商议课程中存在的问题,从而做出相应
当今世界,大数据、云计算、人工智能等新一代信息技术与会计行业深度融合,推动着财务共享服务中心智能化水平和业务处理效率不断提升.中美贸易摩擦,全球不稳定、不确定因素显
有人说:任何历史都是当代史。比如读明清史,事件的演进过程与人物的行为方式,与今天何其相似乃尔!而况国民史,一如厨房砧墩上的牛排,还淌着血丝呢。这是指宏大叙事层面。在个
在我国教育教学体制改革日益推进的大背景下,很多现代化教学理念在高中语文课堂教学中得到了有效应用,情感教育既能够引导学生树立正确的价值观念,又可以促进学生的个性成长,为学
一场关系全局、覆盖广泛、意义重大的“创建先进基层党组织、争做优秀共产党员”活动已经拉开帷幕。开展创先争优活动,是党的建设一项重要的经常性工作,紧紧抓住“经常性”这
游戏作为幼儿教育活动开展的重要形式,也是促进幼儿身心健康发展的重要方式,既是幼儿教育活动开展的基本形式,又承载着丰富的幼儿教育内容.因此具有娱乐性、自主性和生活性的