论文部分内容阅读
番茄是重要的蔬菜作物之一,也是遗传研究的模式植物,分子标记是遗传育种研究的重要工具.微卫星标记(SSR)相对于其它标记而言,具有诸多的优点,特别适合于大群体分析,但到目前为止番茄上可供利用的SSR标记不多,因此,发展更多的番茄SSR标记具有重要的意义。用传统的筛选文库方法发展SSR标记成本较高,近年来,数据库中的番茄序列快速增加,特别是国际番茄基因组测序计划启动后产生了一大批序列数据,为利用数据库序列发展SSR标记提供了便利.本研究利用数据库序列对番茄基因组SSR.的丰度及分布进行了分析;通过搜索不同时期三组序列数据发展了一批SSR标记,并利用番茄渐渗系(ILs)对部分标记进行了快速区段定位;对部分SSR标记在栽培番茄中的等位基因变异也进行了分析。主要的结果如下:
1.利用3个BAC文库末端序列搜索基序长度为2~6个核苷酸的SSR,估计番茄基因组SSR频率为1/24.3kb;利用位于染色体2、4、8上的354个全长BAC估计番茄基因组SSR频率为1/15.7kb,不同染色体上SSR频率也有很大区别,染色体2和4上SSR频率较小,但染色体8上SSR频率较高.基序长度为2核苷酸的重复在番茄基因组中最丰富,比其它4种基序的SSR数目总和还多.最常出现的2、3、4、5、6核苷酸基序分别是AT、AAT、AAAT、AAATT、AAGATC;在BAC末端序列中出现频率较高的基序依次为AT、AC、AG、AAT、AAG、AAAT、ATAC及AAC,在全长BAC序列中出现频率较高的基序依次为AT、AAT、AAG、AG、AAAT、TC、AC及AAC.
2.应用生物信息学方法发展了296个在栽培番茄Solanum lycopersicum cv.M82的基因组DNA上能成功扩增的SSR新标记,利用来源于M82及S-pennellii LA716的IL系对256个标记进行了区段定位和验证.其中,根据基因组概略序列(GSS)发展了33个标记,26个被定位;根据BAC末端序列发展了180个标记,166个被定位;根据已测序的番茄BAC序列发展了83个位置特异标记,58个标记的位置被验证与BAC符合,6个标记被重新定位.
3.来源于GSS序列及BAC末端序列的SSR有集中分布于着丝粒周围的趋势,不统计定位于染色体1上的标记,57个(占标记数的39.6%)标记被定位于遗传距离为154.4cM(不计算染色体1,占总长的13.9%)的含有着丝粒区段.通过分析染色体4上已经测序的BAC序列所含的SSR频率,得出SSR集中分布于着丝粒周围的原因除相对密集外(由于着丝粒周围实际物理长度很长、遗传距离很短,而使得SSR密度在遗传图谱上相对密集),还存在实际密集,即着丝粒周围单位物理长度上SSR密度比非着丝粒区段大.提出了一种从基因组随机序列发展偏向分布于常染色质区SSR标记的新策略:在选用序列发展SSR标记之前,首先分析用于发展标记的序列或其邻近序列(如BAC的另一末端序列)是否含有基因编码区,选用与基因编码区相邻的序列发展SSR标记.并用试验结果证明提出的新策略是有效的。
4.部分标记的位置与BAC的位置不相符:67个位置特异SSR标记中,9个标记不在BAC所在的染色体上;用来自GSS序列及BAC末端序列的SSR标记对数据库中已经测序的BAC进行搜索,38个标记能找到对应的BAC,但有8个标记定位的位置与BAC在染色体上的位置不相符.
5.用IL系对发展的标记进行定位发现,没有一个标记被定位于IL1-1及IL1-2的重叠区.为证实IL1-1及IL1-2的真实性,用S.lycopersicum cv.860及S.pennellii LA716构建的F2群体中的交换株进一步确定了该区域SSR标记的顺序,证实IL1-1中导入片断的长度比发表的几图谱中标注的要短.该现象是在种子繁殖过程中发生还是在构建Ⅲ群体时发生,正在进一步试验.
6.分析了30个基因组SSR及14个EST-SSR标记对在来自三个国家的27份栽培番茄材料上的等位基因变异情况.23个标记能检测出2~4个等位基因,各多态性标记的PIC指数为0.07~0.68,基因组SSR比EST-SSR更能揭示番茄品种间多态性,主要体现在多态性标记百分率基因组SSR比EST-SSR更高;6个标记能将27份栽培番茄材料区分开。
本研究发展并定位了一批新SSR标记,为番茄遗传育种提供了更多的标记选择,并为下一步构建番茄SSR遗传图谱奠定了基础。