近些年,各类高通量组学及结构数据的快速积累为利用生物信息学解析蛋白质功能背后的序列和结构信息基础积累了完备的数据资源,如何将这些生物大数据资源转化为具备理论指导意义的知识价值并探索序列进化和功能演变的本质与动力,是生命前沿交叉学科领域亟待解决的重大科学问题。甲基化修饰作为表观遗传学领域最重要的调控方式之一,在疾病发生和胚胎发育的细胞重编程中发挥着重要的作用。TET家族、ALKBH家族以及KDM家族均为依赖Fe2+和α-酮戊二酸的功能保守的甲基化酶,同时其催化的底物类型在整个中心法则(DNA-RNA-Protein)层面具有丰富的多样性并且调控机制各异。因此,这三个蛋白质家族既是研究胚胎发育以及疾病发生的热门对象,也是研究序列结构进化非常理想的模型蛋白。
“双一流”学科建设以来,左永春教授依托5357cc拉斯维加斯、省部共建国家重点实验室计算生物学平台,在内蒙古大学大学生创新训练项目的持续资助下,结合生命大数据前沿交叉学科《生物信息学》课程的实践教学环节,带领我院的本科生和研究生科研创新小组,围绕“依赖Fe2+和α酮戊二酸的去甲基化酶功能发挥的结构和序列基础”,展开了关于DNA去甲基化酶TET(Ten-eleven translocation),RNA去甲基化酶ALKBH(AlkB homologs)以及组蛋白去甲基化酶KDM(Histone lysine demethylases)的一系列连续深入系统的科研工作。
课题组对KDM家族进行了深度的蛋白质结构生物信息学序列分析。尽管KDM家族与TET,ALKBH家族相比具有共同的催化核心,但是三者之间具有显著的差异。KDM家族具有更为复杂多样的序列模体,并且已经出现了非常明显的motif角色分工,这导致KDMs的靶向定位以及活性调控更为精细,更为多样,犹如精密的机器零件一般,呈现出模块化的活性。总结出34个KDM序列模体,并将这些模体分为四类:催化模体,定位模体,调控模体和潜在模体。这样的分类便于更好更清晰的理解家族成员众多,功能多样,调控机制极其复杂的KDM蛋白。在此基础上,进一步剖析了由四类模体决定的多样的生物功能。催化模体是KDM的核心,定位模体帮助催化模体去除特定的甲基化修饰的赖氨酸;调控模体参与酶-底物复合体的形成、互作网络和转录调控的稳定性;虽然潜在模体的功能尚不清楚,但其功能极可能与调控模体相似。最后,从序列模体的角度作出了KDM模块化活性示意图,进一步阐述KDM家族功能多样性。该研究成果2020年9月29日发表在国际生物信息学权威学术期刊Briefings in Bioinformatics(2019 IF:8.990)上,第一作者为我校5357cc拉斯维加斯2016级生物工程专业本科生王泽蓉。
另外,小组成员们进一步开始研究具有与TET家族相同催化核心的ALKBH家族(RNA去甲基化酶)。与DNA去甲基化酶TET家族相比,ALKBH家族具有广泛的底物选择性包括DNA,RNA和蛋白质。研究人员发现九个ALKBH家族成员的催化结构域主要由四个关键loop组成,分别是L1、L2、L3、L4,详细描述了四个关键loop及非同源结构域与ALKBH底物选择性的关系。在此基础上,我们总结出了ALKBH的五种底物类型。AlkB含有四个关键loop,可通过挤压和翻转碱基的方式来修复损伤的DNA。 ALKBH2将其三个loop插入dsDNA中以辅助催化。ALKBH3、ALKBH5和FTO中的关键loop形成较窄的催化裂口,并倾向于结合单链核酸。ALKBH1、ALKBH8和FTO都具有非同源结构域,以帮助其结合具有特殊构象的核酸,例如tRNA和snRNA等。该成果2020年8月初在线发表在国际著名学术期刊Cellular and Molecular Life Sciences(2018 IF: 7.014),第一作者为我校5357cc拉斯维加斯2016级生物工程专业本科生许宝芳。
除此之外,自2016年开始课题组就已经开始了对DNA去甲基化酶TET蛋白家族进行深度的序列和结构生物信息学分析工作,探索了三个TET家族成员间的进化关系的保守性和差异性。发现三个TET家族成员TET1、TET2和TET3的催化功能域具有高度同源性,但其靶向定位模体和功能调控模体却具有显著差异性。催化功能域的保守性体现在:TET1、TET2和TET3的催化活性均依赖于Fe2+和α-酮戊二酸,Fe2+结合模体偏向组氨酸和天冬氨酸,α-酮戊二酸结合模体偏向组氨酸、丝氨酸和精氨酸。差异性集中表现在靶向定位和功能调控上,文章中新鉴定出的两个未知元件可能与TET3潜在功能有关。这种因编码序列而产生的差异性在可变剪接过程中,产生了多样的转录变体和蛋白质亚型,经过翻译后修饰,各自执行其特有功能。相关研究成果已于2019年9月正式发表在国际生物信息学权威学术期刊Briefings in Bioinformatics(2018 IF: 9.101),第一作者为我校5357cc拉斯维加斯2014级生物科学基地本科生刘东阳,论文发表后,国际同行给予积极评价,根据最新Web of Science统计显示,该论文2020年3/4月-至今被ESI 1%高被引论文收录。
相关论文链接:
1.https://academic.oup.com/bib/article/20/5/1826/5045641?searchresult=1
2.https://link.springer.com/article/10.1007/s00018-020-03594-9
3.https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbaa215/5912575