概述
AQ 实验室(AQ Laboratory)是一个以开源方式推进生物分子结构预测与蛋白质设计研究的组织,托管于 GitHub。其目标是将前沿的结构生物学模型工程化、模块化并可复现,降低研究与应用门槛,促进社区合作与加速科学发现。组织下的仓库覆盖了从大型结构预测模型的复现、扩展到蛋白质生成、分子对接与标准化数据集的构建等多个方向。
核心能力
- 开源重现与工程化: 提供对 AlphaFold2 的 PyTorch 重现(如 openfold),强调可训练性、显存友好与 GPU 适配。
- 新一代结构预测与设计: 推出基于更先进思想的 openfold-3 与蛋白质扩散生成模型 genie/genie2,用于无条件蛋白生成与基序(motif)支架设计。
- 数据与基准: 维护用于机器学习的标准化数据集(如 proteinnet),方便模型训练与评估的一致性。
- 轻量化工具与管道: 包括轻量分子对接模型 QuickBind、用于体内/体外设计评估的 insilico_design_pipeline,以及与免疫受体相关的工具(如 TCRcube)。
- 可复现实验与教学资源: 通过 Jupyter Notebook、示例代码与文档,降低新手上手成本,便于教学与复现科学结果。
主要功能(编号列表)
- 结构预测复现: 基于 PyTorch 的 AlphaFold2/3 思路重现,支持训练、推理优化与显存管理。
- 蛋白质生成与扩散模型: 提供用于无条件生成和基序支架设计的扩散类模型,实现定向设计能力。
- 标准化数据集: 提供用于机器学习的蛋白质结构数据集,便于统一评估与基准对比。
- 分子对接与轻量模型: 提供快速、可解释的分子对接实现,适合筛选与解释性分析。
- 工程管道与示例: 包含设计评估流水线、示例笔记本与技术文档,便于复制研究流程。
技术栈与许可证
AQ 实验室的项目主要采用 Python、Jupyter Notebook 等工具链,常用数值与深度学习库用于模型训练与推理。多数仓库采用 Apache-2.0 或 MIT 等宽松开源许可证,利于研究复现与工业应用。项目也会包含模型权重、训练脚本、示例数据与 CI/文档说明,方便开发者直接上手。
如何入门
- 浏览组织下的代表性仓库(例如 openfold, openfold-3, genie2, proteinnet)。
- 阅读各仓库的 README 与快速开始指南,按说明准备依赖与数据。通常需要具备 Python 环境与常见深度学习框架(如 PyTorch)。
- 运行示例 Notebook 或提供的推理脚本,以在本地重现结果;有能力的用户可尝试训练或微调模型。
- 若希望贡献,关注仓库 issue、PR 以及贡献指南,遵守项目的代码风格与许可要求。
推荐原因
AQ 实验室聚焦于将前沿结构生物学模型以工程化、可复现的方式开放给社区,既适合学术研究复现,也便于工程团队在此基础上进行二次开发。其仓库在设计上注重可训练性、显存友好性与模块化,配合标准化数据集和示例笔记本,可以显著缩短从概念到实验的周期。对于从事蛋白质结构预测、计算设计或想要基于现有模型进行创新的开发者与研究人员,AQ 实验室是一个高价值的资源库。


