论文部分内容阅读
种子是植物新一代的开始,是农业生产的基本资料,也是人类营养和工业原料的主要来源。种子的结构复杂,其发育过程涉及到大量不同的基因。分析种子发育过程中的基因表达谱,将有助于阐明种子发育的遗传调控机制。本研究对加拿大国家研究委员会植物生物技术研究院提供的模式植物拟南芥三个种子发育阶段(授粉后第9、12和15天)的mRNA深度测序数据进行分析,旨在挖掘其中包含的各种生物学信息,为植物种子发育遗传机理的深入研究提供参考。主要研究内容和结果如下:(1)数据的基本分析:将Illumina测序的原始数据进行格式转换、去除杂质序列,然后匹配到参考拟南芥基因组(TAIR9)中。有76.41%的读段定位到单个位点,其中有88.97%、9.73%和1.03%的读段分别定位到外显子区、基因间区及内含子区。用单定位读段构建了一张拟南芥种子发育转录图谱,发现3号染色体在三个时期都有着较强的表达活性,并且每条染色体上读段分布的趋势大致相近。(2)基因注释结构的修正:提取基因组中被读段覆盖的次数大于等于2且位置连续的区域作为转录活性区,然后将这些转录活性区与现有的基因注释比较,对8个基因的注释结构进行了修改,补充或延长了它们的3’UTR或5’UTR。(3)新基因的预测:找出位于基因间区域(一个基因3’端下游200 bp到下一个基因5’端上游200 bp之间的区域)的潜在基因模型,再从中挑选出20条长度大于150 bp且平均覆盖度大于2的基因模型作为候选的新基因,用GENSCAN软件识别可读框(ORF),结果预测到2个新基因。(4)差异表达基因分析:参照已有的基于测序的差异基因检测方法[1],共检测出1,267个差异表达的基因。采用k均值方法,依据基因的表达模式将它们分成了6类。GO分析表明,这6类分别富集了5个、11个、8个、8个、4个以及3个GO条目。根据GO分析的结果,描述了拟南芥种子发育的形态建成末期,成熟末期以及脱水期种子理化状态的变化。(5)基因调控网络分析:将前人遗传分析已经证明的4个关键调控基因(LEC1、LEC2、FUSCA3和ABI3)在三个时期的表达情况与基因芯片数据进行对比,发现二者大致吻合。从基因互作数据库里抽取出这4个关键基因的所有互作关系,构建了一个拟南芥种子成熟关键基因的调控网络。