中国科学院东北地理与农业生态研究所研究员冯献忠课题组等选择1份东北野生大豆、7份我国代表性栽培种,结合平均50×的三代测序和Hi-C测序,组装了高质量大豆参考基因组。组装的8个大豆基因组大小范围为986.1-1001.3Mb,Contig N50=1.4-6.1Mb,BUSCO完整性评估为96.7%-97.3%;结合同源注释、从头注释、转录组辅助注释,在8个大豆中注释得到57286-58392个基因。
基于8个高质量的大豆基因组,研究团队鉴定到186-427万个SNP,44-92万个InDel,11750-25330个大的InDel,706-3006个易位事件,200-413个倒位事件。在野生大豆中鉴定到60个栽培大豆中缺失或变短的基因,以及野生大豆种质缺失或变短却在栽培中存在的185个基因。
相关研究成果以Eight soybean reference genome resources from varying latitudes and agronomic traits为题,发表在Scientific Data上。该研究为大豆结构变异与遗传育种研究提供了新的参考基因组。研究工作得到国家重点研发计划、中科院重点研究项目、山东省“泰山学者”项目等的资助。
图1.8个测序大豆品种
图2.8个测序大豆品种基因组差异比较