广泛种植的六倍体普通小麦具有庞大而复杂的基因组,高质量的普通小麦全基因组序列于2019年初公布,大小约为16 Gb,是人类基因组的5倍。其中93%是非编码序列,蕴含着丰富的基因远端调控元件。在小麦全基因组水平准确鉴定顺式元件并解析其调控机制,是研究小麦多倍化及驯化过程中基因表达调控的关键步骤。由于表观修饰在基因调控过程中发挥了重要作用,有机整合表观组信息有助于在全基因组水平精准预测顺式调控区域。但是,与基因组序列相对简单的模式生物相比,庞大而复杂的小麦基因组对组学数据产生与数据分析及机制解析均带来巨大挑战。
合作研究团队生成并整合数十套小麦表观组数据,通过开发和运用针对小麦表观组数据的整合计算方法与分析流程,系统挖掘了小麦的全基因组顺式调控元件并初步探索其作用机制,主要包括以下方面:1)刻画不同类型调控元件的表观修饰组合模式,以此为基础预测上千个新的顺式作用元件,其中包含启动子和增强子等。通过瞬时转化实验进一步证明功能元件预测具有较高的准确度。上述工作锁定六倍体小麦中1.5%基因组区域存在活跃的顺式元件,为小麦功能基因组研究提供了重要参考信息,极大减少了基因调控机制研究工作量。2)鉴定增强子与启动子的特异性序列特征,并揭示二者的差异调控机制。3)通过对小麦3套亚基因组的比较揭示了基因调控的选择压力作用于序列和染色质结构两个层面。
该研究得到中科院战略性先导科技专项、国家自然科学基金委和教育部的资助。
论文链接
刻画普通小麦表观组图谱(a)并对全基因组顺式作用元件进行挖掘(b)与活性鉴定(c)