logo好方法网

一种基于全基因组重测序的甘蓝型油菜蜡粉基因定位方法


技术摘要:
本发明提供了一种基于全基因组重测序的甘蓝型油菜蜡粉基因定位方法,属于生物信息技术领域。本发明以分离群体为基础,建立近等基因系。采用混合分组分析,选近等基因系中3:1分离群体中的无蜡粉植株和全部有蜡粉表型不分离群体以及3个亲本,共建5个DNA池用于基因组重测  全部
背景技术:
甘蓝型油菜(Brassica  napus  L.)是油菜三大类型之一,是由白菜(AA,n=10)与 甘蓝(CC,n=9)通过自然种间杂交后双二倍化进化而来的一种复合种。植物的表面一般覆 盖有一层蜡质。蜡质是长链脂肪酸的混合物,它们具有防止紫外线辐射损伤,减少植物表面 水分过度蒸发和保护植株免遭病虫危害,并影响植株的光合效率和花粉育性。一般来说,甘 蓝型油菜的茎秆,叶片及角果均有蜡粉覆盖,而无蜡粉突变体的茎杆,叶片及角果皮均不被 蜡粉,表面油亮,整个生育期此表型都明显可见。目前,对甘蓝型油菜蜡粉基因进行定位的 方法需要检测所有子代个体,这种检测手段工作量大,检测效率低。
技术实现要素:
本发明的目的在于提供一种基于全基因组重测序的甘蓝型油菜蜡粉基因定位方 法,不需要检测所有子代个体,而是将两种极端性状的子代进行混池分析,检测工作量小, 检测效率高。 为了实现上述发明目的,本发明提供以下技术方案: 本发明提供了一种基于全基因组重测序的甘蓝型油菜蜡粉基因定位方法,包括以 下步骤: 1)以甘蓝型油菜纯合两型系D0721的不育株为母体,临保系D1577为父本,进行杂 交,得到F1代全不育系; 2)将F1代全不育系和无蜡粉性状的恢复系D0936进行杂交,得到F2代; 3)在F2~F5代的15:1分离群体中选择有蜡粉性状的植株自交,得到F6代; 4)在所述F6代的3:1分离群体中选择无蜡粉性状的植株作为第一子代备选植株, 在所述F6代的全部有蜡粉群体中选择有蜡粉性状的植株作为第二子代备选植株,将D0721 作为第一亲本备选植株,D1577作为第二亲本备选植株,D0936作为第三亲本备选植株,得到 五组备选植株; 5)分别提取所述五组备选植株的基因组DNA,利用提取到的基因组DNA分别构建文 库,对各个文库进行30×覆盖度的全基因组重测序,得到五组测序数据,分别为第一子代测 序数据、第二子代测序数据、第一亲本测序数据、第二亲本测序数据和第三亲本测序数据; 6)利用Trimmomatic对所述五组测序数据分别进行质量控制,选择Pherd分值大于 Q20的序列样本,得到五组待分析数据,分别为第一子代待分析数据、第二子代待分析数据、 第一亲本待分析数据、第二亲本待分析数据和第三亲本待分析数据; 7)将所述五组待分析数据分别与参考基因进行比对,去除PCR重复,注释SNP和 InDel,完成基因分型; 4 CN 111575399 A 说 明 书 2/8 页 8)基于所述基因分型的结果,以第一亲本待分析数据、第二亲本待分析数据和第 三亲本待分析数据作为参照,分别计算第一子代待分析数据和第二子代待分析数据在每个 多态性位点上的SNP-index,统计平均值,得到两组SNP-index,分别为第一SNP-index和第 二SNP-index; 9)取第一SNP-index和第二SNP-index差值的绝对值,绘制SNP-index图;选取95% 和99%的置信水平作为筛选的阈值,超过阈值外的区域作为候选区域; 10)对所述候选区域内SNP的碱基与参考基因相应位置的碱基进行比对,统计第一 亲本待分析数据、第二亲本待分析数据、第三亲本待分析数据、第一子代待分析数据和第二 子代待分析数据中的碱基突变类型,筛选出亲本和与之近似的混池材料中碱基突变类型相 一致的候选基因,作为候选基因; 11)利用Non-Redundant  Protein  Sequence、Gene  Ontology和Kyoto  Encyclopedia  of  Genes  and  Genomes数据库注释对所述候选基因进行初步筛选,得到目 的基因;采用BRAD数据库和TAIR数据库对所述目的基因进行同源性分析和功能预测; 步骤1)中所述甘蓝型油菜纯合两型系D0721的保藏编号为:CCTCC  NO:P202001;所 述临保系D1577的保藏编号为CCTCC  NO:P202002 步骤2)中所述恢复系D0936的保藏编号为CCTCC  NO:P202003。 优选的,步骤3)中所述第一子代备选植株和第二子代备选植株的数量分别为40~ 60株;所述第一亲本备选植株、第二亲本备选植株和第三亲本备选植株的数量分别为15~ 25株。 优选的,在步骤5)分别提取所述五组备选植株的基因组DNA后,还包括将提取到的 五组备选植株的基因组DNA随机打断成350bp的片段,基于打断后的基因组DNA片段,采用 TruSeq  DNA  LT  Sample  Prep  kit试剂盒分别构建文库。 优选的,步骤8)中所述SNP-index根据reads测序深度信息计算,利用测序reads对 每个碱基位点的碱基进行统计,计算与作为参照的基因组不相同的reads条数占总条数的 比例,得到碱基位点的SNP-index。 优选的,步骤8)所述统计平均值的过程中定位时以1Mb为窗口,以10Kb为步移。 本发明的有益效果:本发明提供了一种基于全基因组重测序的甘蓝型油菜蜡粉基 因定位方法。本发明以分离群体为基础,建立近等基因系。采用混合分组分析(Bulk  segregant  analysis,BSA),选近等基因系中3:1分离群体中的无蜡粉植株和全部有蜡粉表 型不分离群体以及3个亲本,共建5个DNA池用于基因组重测序。利用重测序数据进行遗传关 联性分析,将控制蜡粉性状的位点定位在A08染色体的590663~1657546bp区域内。本发明 的方法最大的特点是不需要检测所有子代个体,而是将两种极端性状的子代进行混池分 析。并且,本发明的方法测序数据充足、质量合格,能够用于下一步分析。 生物保藏信息 甘蓝型油菜纯合两型系D0721的保藏编号为CCTCC  NO:P202001、临保系D1577的保 藏编号为CCTCC  NO:P202002、恢复系D0936的保藏编号为CCTCC  NO:P202003,保藏于中国典 型培养物保藏中心,保藏时间为2020年5月27日,保藏地址为湖北省武汉市武昌区八一路 299号武汉大学校内;所述甘蓝型油菜纯合两型系D0721的保藏编号为CCTCC  NO:P202001; 所述临保系D1577的保藏编号为CCTCC  NO:P202002;所述恢复系D0936的保藏编号为CCTCC  5 CN 111575399 A 说 明 书 3/8 页 NO:P202003。 附图说明 图1为SNP变异位点注释情况; 图2为InDel变异位点注释情况; 图3为利用亲本纯合差异位点筛选后的突变子代ΔSNP-index定位图;其中,蓝色 箭头:关联阈值前1%以上的候选区域(590663~1657546bp)在油菜A08染色体上;(1)绿色 点为SNP-index或ΔSNP-index;(2)红色线为SNP-index或ΔSNP-index划窗后的拟合线; (3)蓝色线为95%置信线;(4)橘黄色线为99%置信线; 图4为利用qRT-PCR方法分析16个候选基因在甘蓝型油菜无蜡粉亲本D0936和有蜡 粉亲本D0721叶片中的表达模式。
分享到:
收藏