论文部分内容阅读
本研究首次采用新一代高通量转录组测序技术对10cm、50cm、100cm和150cm四个不同生长高度的慈竹笋进行转录组测序,对测序得到的原始数据进行拼接组装、结构分析、功能注释、表达分析等一系列生物信息学分析,主要结果如下: 1.慈竹10cm、50cm、100cm和150cm四个样品分别得到4.06Gb、4.20Gb、1.58Gb和4.14Gb的数据量,组装后分别得到56,743、56,862、39,480和56,404条Unigenes,最后做进一步的聚类分析,整合得到慈竹物种的Unigene数据库,共111,137条Unigenes,覆盖度在80%以上的Unigenes有64,403条,占慈竹Unigenes总数的57.95%。共有110,179条Unigenes成功预测到ORF;对1kb以上的Unigenes(21,518条)做SSR分析,发现5,163条Unigenes含有SSRs。 2.慈竹111,137个Unigenes中有63,094(56.77%)条Unigenes在COG、GO、KEGG、Swiss-Prot和Nr数据库中被注释。 3.慈竹四个样品间差异表达基因最多的为10cmvs150cm(2,601条Unigenes),其次是10cmvs50cm(1,828条Unigenes),最少的是50cmvs100cm(1,224条Unigenes)。 4.慈竹四个样品间纤维素和木质素合成途径中关键酶基因的差异表达分析表明,大部分Unigenes都随着笋高度的增加,呈现不同程度的上调表达,只有少部分Unigenes下调表达。 5.在四个不同生长高度的慈竹笋中鉴定了9种差异表达的转录因子,其中最多的是MYB(36条);其次是WRKY和bHLH(都有28条);最少的是HD-ZIP(2条)。 6.慈竹四个样品的Unigenes分别与水稻、毛竹、短柄草、玉米和高粱等禾本科植物转录本序列数据库进行Blast比对,其与毛竹相匹配的基因数最多,其次依次是水稻、短柄草、高粱和玉米。 7.慈竹四个样品的纤维素、木质素合成相关基因和转录因子分别与水稻、短柄草、玉米和高粱的转录本序列物数据库进行Blast比对,慈竹的大部分关键酶基因要多于其它四种植物。