今日(3/27),Google DeepMind团队和新加坡科研局(ASTAR)分享了蛋白质预测模型AlphaFold及其数据库的亮点应用,比如用来理解水稻磷酸化过程的蛋白质结构,找出能在恶劣条件下生长的优良水稻,或是用来寻找蜜蜂免疫系统中的关键蛋白质结构,以及理解STIP1蛋白质结构,也就是一种能减少帕金森氏症患者大脑海中蛋白质聚合的蛋白质。

此外,Google也透露,在台湾已有2万7千名用户采用AlphaFold数据库,使用范围包括结构同源性搜索、理解蛋白质功能,以及生成精确的串行比对等。

AlphaFold预测蛋白质结构,解决50年难题

Google DeepMind生命科学产品经理Dhavanthi Hariharan指出,AlphaFold的起源,来自于团队想解决蛋白质折叠难题。在过去,解析蛋白质结构的传统方法非常耗时,比如人们花了20年才理解血红素的立体结构。因此过去50年来,科学家们一直想突破蛋白质3D结构的预测难题,希望用更快更准确的方法完成预测。

Dhavanthi Hariharan解释,蛋白质由一连串氨基酸单元组成,这些氨基酸有着立体结构,这些结构影响着蛋白质的功能。于是DeepMind团队假设,如果已知蛋白质中氨基酸单元的串行,那么就能用来预测蛋白质结构,解决蛋白质折叠问题。

于是他们用深度学习技术,打造出Alpha fold 2,可用氨基酸串行精准预测出高品质的蛋白质结构。他们也在2021年,与欧洲生物资讯研究所联手发布AlphaFold蛋白质结构数据库,包含2亿个蛋白质结构预测,免费提供给研究单位使用。

至今,这个蛋白质结构预测数据库AlphaFold,在全球已有250万名用户、横跨190个国家,其中超过100万名用户来自亚太地区。

在台湾,则有27,000名用户采用了AlphaFold数据库,范围涵盖结构同源性搜索、理解蛋白质功能,以及生成精确的串行比对。例如,台大研究员用AlphaFold来鉴定和表征参与配子融合的蛋白质超家族,也就是具有相似核心结构的蛋白质群体,并运用其准确性,来进行结构同源性搜索。

3个亮点应用:水稻、蜜蜂和帕金森氏症

Dhavanthi Hariharan分享几个有趣的AlphaFold应用案例,首先是菲律宾国际稻米研究所的稻米磷酸化过程研究,他们利用AlphaFold 3来预测这个过程中的蛋白质立体结构,让科学家理解磷酸化过程在分子上是如何进行的。如此就能知道,为何有些稻米更能抗旱或疾病,进而能开发出在恶劣条件下生长的更优良水稻品种。

另一个例子是,运用AlphaFold来理解蜜蜂免疫系统中的关键蛋白质结构,还能根据这个知识,来保护同样脆弱的动物,如青蛙、海龟等。Dhavanthi Hariharan指出,通过AlphaFold,可将原本数年的研究时间缩短为几天。

还有个例子是加速帕金森氏症的蛋白质结构研究。新加坡科研局ASTAR研究员Jackwee Lim指出,帕金森氏症患者通常会有2种特征,如行动受影响,以及蛋白质聚合/累积。然而,一种名为STIP1的蛋白质可以减少蛋白质聚合现象,这也是新加坡科研局用AlphaFold的研究对象,用来预测STIP1蛋白质的分子结构(如下图),希望以这些结构和蛋白质的作用机制,来改善未来的帕金森氏症诊断和治疗。