论文部分内容阅读
目的:⑴建立生长发育迟缓智力障碍全基因组拷贝数变异(CNV)数据库。⑵分析拷贝数变异序列特征,对其形成机制进行初步研究。
方法:①针对实验室积累的生长发育迟缓智力障碍患者全基因组拷贝数变异数据,以Windows+Apache+MySQL+PHP为平台开发数据库。②通过UCSC查询CNVs断裂点区域序列LCRs/SDs的分布特征,使用RepeatMasker对CNVs断裂点区域及504个重组冷点对照中SINEs、LINEs、LTR等重复元件进行分析检测。
结果:⑴构建了生长发育迟缓智力障碍全基因组拷贝数变异(CNV)数据库。该数据库包括管理员登录系统、数据库查询系统和数据库管理系统。收集了来自168个生长发育迟缓智力障碍患者共812个CNVs数据。⑵在我们所研究的297个CNVs中近端和远端的断裂点区域都富含LCRs/SDs并具有高度的序列相似性的CNVs有19个,占6.40%;近端和远端的断裂点区域都富含LCRs/SDs但序列相似性较低的CNVs有53个,占17.85%;只有一端断裂点区域包含LCRs/SDs的CNVs有80个,占26.94%;在断裂点附近区域没有LCRs/SDs的CNVs有145个,占48.81%。对断裂点区域及对照中重复元件的分析结果:Alu SINEs(断裂点区域314/504,62.30%;对照338/504,67.06%);MIR SINEs(断裂点区域191/504,37.90%:对照207/504,41.07%);L1 LINEs(断裂点区域328/504,65.10%;对照344/504,68.25%);L2 LINEs(断裂点区域155/504,30.75%;对照171/504,33.93%);L3 LINES(断裂点区域35/504,6.94%;对照37/504,7.34%);LIR(断裂点区域266/504,52.78%;对照253/504,50.20%)。
结论:①构建了生长发育迟缓智力障碍全基因组拷贝数变异(CNV)数据库。数据库输入数据快速、完整、可靠;数据查询快速准确。㈡在我们所研究的297个CNVs中有19个(6.40%)认为是通过NAHR机制形成;其他CNVs的形成与NAHR机制无关。③除了微卫星重复产生的染色体不稳定性可能与CNVs的形成有关,未发现其他重复元件的存在与基因组不稳定的增加、重组率的提高有明显关联。④Alu SINEs与LCRs/SDs的形成和扩展有关。Alu SINEs通过NAHR机制产生LCRs/SDs,LCRs/SDs之间通过NAHR机制产生CNVs,可能是LCRs/SDs介导CNVs形成的机制之一。