生物复合物准确模型的建立对于细胞功能解析与药物设计至关重要。alphaFold 3(AF3)的出现改变了这一局面,它能够预测包括蛋白质、DNA、RNA、配体小分子、离子和修饰残基在内的复合物的联合结构。AF3的高精度预测能力将为我们更深入地理解细胞功能、合理设计治疗药物以及推动生物科学的发展提供有力的支持。
一、模型预测性能1.蛋白-小分子配体结构预测准确性更高AF3还比各种单一任务模型表现出更高的性能(图1a),包括蛋白-小分子、核酸、共价、抗原抗体等各种分子相互作用。蛋白质-配体结构预测的AF3性能在PoseBusters数据集上进行了160项评估,图1a可见,AF3大大优于基于结构的Vina,以及RFAA模型。图1b-d三个示例,AF3实现了准确的预测,但对接工具 Vina 和 Gold 却不能对接成功。为了与RFAA结果进行比较,作者在PoseBusters V1,V2数据集进行了评估,结果显示,AF3预测性能优于DiffDock、Uni-mol V2、Vina(图1e-j)。
图1 AF3在预测蛋白-小分子结构性能比较(Ref. Fig1/Extended Data Fig3/4)2.蛋白-核酸复合物或RNA单体预测准确性更高AF3够比RoseTTAFold2NA更准确地预测蛋白质-核酸复合物和 RNA 结构(图2)。从图2可见,AF3的蛋白核酸对接成功率远远高于RoseTTAFold2NA算法。
-
图2 AF3在预测蛋白质-核酸复合物结构预测性能比较(Ref. Fig1)PDB数据库中蛋白-RNA,蛋白-双链DNA;CSAP15比赛中RNA单体的成功率。成功率针对复合物是iterface LDDT,单体RNA仅为LDDT。N表示靶点的数量。3.共价修饰预测准确性更高AF3还可以准确预测共价修饰(键合配体、糖基化、修饰的蛋白残基和核酸碱基)(图 3a-b)。修饰包括对任何聚合物残基(蛋白质、RNA或DNA)的修饰。成功率定义为RMSD < 2 Å。
图3 AF3在预测共价修饰性能比较(Ref. Fig1/Extended Data Fig6)。a. 纵坐标成功率定义为配体RMSD < 2 Å 的百分比,N表示靶点的数量。依次为,蛋白键和小分子、蛋白糖基化、蛋白修饰、DNA/RNA修饰。b.在磷酸化 (SEP、TPO、PTR、NEP、HIP)场景,AF3的预测成功率,PTM代表转录后修饰4.蛋白-蛋白/蛋白单体预测准确性更高AF3相对于 AlphaFold-Multimer v2.3也提高了蛋白质复合物准确度(图4)。抗体蛋白质相互作用预测尤其显示出显著的改善。
图4 AF3在预测蛋白-蛋白/蛋白单体性能比较(Ref. Fig1/Extended Data Fig7)蛋白Multimer、蛋白-抗体、蛋白单体在Recent PDB评估集上的预测成功率。蛋白Multimer、蛋白-抗体的成功率定义为DockQ > 0.23。蛋白单体使用LDDT指标定义成功率。N表示靶点的数量。
二、使用操作教程
1.进入AlphaFold Server网站(图5a),该网站提供了访问AlphaFold3的网络服务,无需代码,通过上产数据即可完成包含蛋白质、DNA、RNA、配体、离子的高精度生物分子结构预测。
2. 使用谷歌账号登录之后,进入Server页面,右上角Remaining jobs表示用户剩余的访问次数,每进行一次蛋白质预测,Remaining jobs都会减1。目前AlphaFold Server为每个用户每天提供了10次蛋白质预测的次数,对于大多数人来说应该是足够的(图5b)。
3. AlphaFold Server提供了3个示例数据(图5c)。
4. 下面的Add entity框就是上传数据的地方,可以添加蛋白质、DNA、RNA、配体和离子(图5d)。
5. 当上传完数据之后,点击”Continue and preview job”(图5e)。
6. 之后会有一个确认信息,确认之后即可提交作业(图5f)。
图5 操作流程
一、模型预测性能1.蛋白-小分子配体结构预测准确性更高AF3还比各种单一任务模型表现出更高的性能(图1a),包括蛋白-小分子、核酸、共价、抗原抗体等各种分子相互作用。蛋白质-配体结构预测的AF3性能在PoseBusters数据集上进行了160项评估,图1a可见,AF3大大优于基于结构的Vina,以及RFAA模型。图1b-d三个示例,AF3实现了准确的预测,但对接工具 Vina 和 Gold 却不能对接成功。为了与RFAA结果进行比较,作者在PoseBusters V1,V2数据集进行了评估,结果显示,AF3预测性能优于DiffDock、Uni-mol V2、Vina(图1e-j)。
图1 AF3在预测蛋白-小分子结构性能比较(Ref. Fig1/Extended Data Fig3/4)2.蛋白-核酸复合物或RNA单体预测准确性更高AF3够比RoseTTAFold2NA更准确地预测蛋白质-核酸复合物和 RNA 结构(图2)。从图2可见,AF3的蛋白核酸对接成功率远远高于RoseTTAFold2NA算法。
-
图2 AF3在预测蛋白质-核酸复合物结构预测性能比较(Ref. Fig1)PDB数据库中蛋白-RNA,蛋白-双链DNA;CSAP15比赛中RNA单体的成功率。成功率针对复合物是iterface LDDT,单体RNA仅为LDDT。N表示靶点的数量。3.共价修饰预测准确性更高AF3还可以准确预测共价修饰(键合配体、糖基化、修饰的蛋白残基和核酸碱基)(图 3a-b)。修饰包括对任何聚合物残基(蛋白质、RNA或DNA)的修饰。成功率定义为RMSD < 2 Å。
图3 AF3在预测共价修饰性能比较(Ref. Fig1/Extended Data Fig6)。a. 纵坐标成功率定义为配体RMSD < 2 Å 的百分比,N表示靶点的数量。依次为,蛋白键和小分子、蛋白糖基化、蛋白修饰、DNA/RNA修饰。b.在磷酸化 (SEP、TPO、PTR、NEP、HIP)场景,AF3的预测成功率,PTM代表转录后修饰4.蛋白-蛋白/蛋白单体预测准确性更高AF3相对于 AlphaFold-Multimer v2.3也提高了蛋白质复合物准确度(图4)。抗体蛋白质相互作用预测尤其显示出显著的改善。
图4 AF3在预测蛋白-蛋白/蛋白单体性能比较(Ref. Fig1/Extended Data Fig7)蛋白Multimer、蛋白-抗体、蛋白单体在Recent PDB评估集上的预测成功率。蛋白Multimer、蛋白-抗体的成功率定义为DockQ > 0.23。蛋白单体使用LDDT指标定义成功率。N表示靶点的数量。
二、使用操作教程
1.进入AlphaFold Server网站(图5a),该网站提供了访问AlphaFold3的网络服务,无需代码,通过上产数据即可完成包含蛋白质、DNA、RNA、配体、离子的高精度生物分子结构预测。
2. 使用谷歌账号登录之后,进入Server页面,右上角Remaining jobs表示用户剩余的访问次数,每进行一次蛋白质预测,Remaining jobs都会减1。目前AlphaFold Server为每个用户每天提供了10次蛋白质预测的次数,对于大多数人来说应该是足够的(图5b)。
3. AlphaFold Server提供了3个示例数据(图5c)。
4. 下面的Add entity框就是上传数据的地方,可以添加蛋白质、DNA、RNA、配体和离子(图5d)。
5. 当上传完数据之后,点击”Continue and preview job”(图5e)。
6. 之后会有一个确认信息,确认之后即可提交作业(图5f)。
图5 操作流程