概述
AlphaFold Protein Structure Database(简称 AlphaFold DB)由 Google DeepMind 与 EMBL-EBI 联合开发,旨在为研究者免费提供大规模的蛋白质三维结构预测结果。数据库基于 DeepMind 的 AlphaFold2 模型,结合 UniProt 等公共序列资源,目前已覆盖超过两亿条预测条目,支持站内检索、序列搜索、可视化展示与数据下载,目标是加速基础生物学研究与应用开发。
核心能力
-
搜索与检索: 提供按 UniProt 描述、基因名、序列片段或完整序列的多种检索方式,支持至少 20 个氨基酸的序列搜索。
-
结构预测与置信度评分: 对单链及多聚体(通过开源代码)给出三维原子坐标,并提供 pLDDT(局部置信度)评分以评估预测可靠性。
-
PAE 可视化与下载: 每个预测条目均包含交互式的 PAE(Predicted Aligned Error) 图,用户可下载 JSON 格式的 PAE 数据以进行自定义分析或绘图。
-
大规模数据获取: 提供整个人类蛋白组及多达 47 个重要物种的单独下载包,此外提供手工注释子集(Swiss-Prot)的下载选项,便于离线分析与大规模应用。
-
扩展工具与注释: 集成 AlphaMissense 等下游工具以评估错义突变致病性,并于 2025 年新增 自定义注释 功能,支持用户在 2D 与 3D 轨道上可视化单残基与区间注释。
主要功能(编号列举)
- 结构浏览: 交互式 3D 视图与 2D 跟踪,可查看残基的 pLDDT、PAE 以及自定义注释。
- 数据下载: 单条条目文件、PAE JSON、整套物种下载包与手工注释子集,便于二次开发与离线计算。
- 序列搜索与比对: 支持多种检索输入(文本、UniProt ID、蛋白序列),提高定位效率。
- 突变评估: 通过 AlphaMissense 提供人类错义突变的致病性倾向评分,辅助医学与功能研究。
- 培训与文档: 提供线上课程、方法学论文与 FAQ,帮助用户理解模型假设、局限与使用建议。
使用场景与局限
AlphaFold DB 适合用于蛋白功能注释、结构先导探索、变体效应初步评估与教学示例。其预测在许多单域与保守区域表现优异,但对于高度柔性区域、蛋白-配体相互作用、动力学变化或某些复杂多聚体仍有局限,且 PAE 文件为自定义格式需要用户用脚本解析。数据库鼓励将预测结果与实验数据或其他生物信息学证据结合使用。
推荐理由
如果你的工作需要大规模、开源且可下载的蛋白质结构预测资源,或需要快速获得目标序列的三维模型与置信度信息,AlphaFold DB 是极具价值的起点。它不仅提供丰富的可视化与下载选项,还具有透明的许可(CC-BY-4.0)与完善的教学材料,便于科研、教学与产业应用的集成与传播。


