论文部分内容阅读
圈卷产色链霉菌7100染色体的454高通量测序获得了2,321,457个reads。这些平均长度为387 bp的reads的Newbler2.6拼接获得了一个长度大约为9 Mb,含有1,299个contigs和G+C含量为72.2%的基因组草图。这些contigs的平均长度为7,229 bp;最长的contig长度为74,262 bp;最短的contig长度为500 bp。由于次级代谢产物生物合成基因簇长度在10 kb-200kb之间,所以单个次级代谢产物生物合成基因簇断裂成多个序列片断,并随机散布于基因组草图中。由于目前已发表的次级代谢产物生物合成基因簇预测工具,如antiSMASH、Clustscan、NP.searcher和SBSPKS等都是针对完全测序的基因组,因此基因组草图中次级代谢产物生物合成基因簇的生物信息学预测往往得不到理想的结果。 本研究利用基因簇预测工具antiSMASH结合BLAST分析,随后进行基因组文库筛选及Gap填补的方法,在圈卷产色链霉菌基因组框架中一共挖掘到了35个次级代谢产物生物合成基因簇。除尼可霉素生物合成基因簇外,其余34个基因簇所对应的次级代谢产物未得到分离与鉴定。将这34个次级代谢产物生物合成基因簇的序列与NCBI核酸序列数据库中的已知基因簇序列进行比对。结果表明:与NCBI核酸序列数据库中的已知基因簇序列一致性在80%以上的有14个,30%-50%之间的有9个和30%以下的有11个。为了研究这些次级代谢产物生物合成基因簇的转录情况,本论文工作选用了三种培养基SP、SMMS和R5对圈卷产色链霉菌进行了发酵,并选取了48 h、96 h和120 h三个时间点对35个基因簇在以上三种培养基中的转录情况进行了分析。结果表明:1.17个基因簇在三种培养基中都转录;3个基因簇在一种或两种培养基中转录;15个基因簇在三种培养基中都不转录;2.在不同的培养基中,基因簇的转录丰度不同。15个在三种培养基中均不转录的基因簇被定义为隐性基因簇。根据序列分析结果,本论文工作选取了nrps2和pks-nrps1两个隐性基因簇作为研究对象进行激活。nrps2基因簇的激活主要采用了调控基因的遗传操作策略,分别构建了 or f22和or24/25基因的过表达菌株(7100-hrdBorf22和7100-hrdBorf24/25)和orf25基因的缺失突变株(△orf25)。但是,野生型菌株与突变株发酵液的生物活性检测与HPLC图谱分析未发现明显的差异。pks-nrps1基因簇的激活主要采用了基因簇的异源表达策略,构建了含有pks-nrps1基因簇的整合型质粒(pPKS-NRPS1),并将其导入M145,M1146,M1152和M1154异源宿主中。但是,发酵液的生物活性检测和HPLC图谱分析均未检测到异源菌株与宿主菌株之间的差异。