ArviZ 是一个面向贝叶斯模型的开源工具集,旨在与具体推断后端解耦,提供统一的探索性分析与诊断手段。项目跨语言、多库协作,包含 ArviZ.py、ArviZ.jl、xarray-einstats 等子库,并通过 GitHub 开发与社区共治,采用 Apache 或 MIT 等开源许可证免费发布。ArviZ 提供丰富的可视化、收敛诊断、后验汇总与模型比较功能,支持残差与预测检验(posterior predictive checks)以及基于 InferenceData 的标准化数据结构,便于与 PyMC、Stan、NumPyro 等生态对接并在科研与生产环境中复用。
Count Bayesie 是一个聚焦概率论与贝叶斯思维的技术博客,作者以实证与数学推导为主线,讲解统计建模、概率计算与机器学习相关主题。文章涵盖从理论概念到可复现实现的完整流程,包括线性扩散模型的分解、用 GPT 替代 A/B 测试的探索、卷积在概率中的应用、利用隐含波动率推断市场概率分布等。博客常结合代码示例(如使用 JAX)、直观比喻和数学推导,适合想深入理解概率工具并将其应用于实际问题的研究者与工程师。整体风格兼顾严谨与教学性,适合作为进阶学习与问题解决的参考资料。
Pyro 是一个以 Python 为实现语言、并以 PyTorch 作为后端支持的通用概率编程语言(PPL)。它结合了深度学习与贝叶斯建模的优点,旨在提供既具表达力又可扩展的概率模型构建工具。Pyro 强调四大设计原则:**通用性**(能表示任意可计算的概率分布)、**可扩展性**(能处理大规模数据)、**简约性**(由少量强大且可组合的抽象构成核心)及**灵活性**(在自动化与可控性之间提供平衡)。此外,Pyro 社区还推出了基于 NumPy 和 JAX 的衍生项目 NumPyro,针对 HMC 和 NUTS 等方法提供大幅加速。项目采用 Apache 2.0 许可证开源,并在学术和工业界(如多所高校与公司)得到广泛使用与引用。
PyMC 是一个面向 Python 的概率编程库,专注于构建贝叶斯模型并通过马尔可夫链蒙特卡洛(MCMC)等方法进行拟合与推断。它提供简洁友好的 Python API,使用户能够用熟悉的语法定义模型、采样后验并进行预测与不确定性量化。PyMC 集成了现代推断算法(如 NUTS、变分推断 ADVI)、使用 PyTensor 作为计算后端以提高性能并支持 GPU 加速,同时与 ArviZ 等可视化与诊断工具无缝对接。官网提供丰富的入门教程、示例笔记本和案例(如线性回归示例),并有活跃的社区支持(Discourse、GitHub、会议与办公开放时间)。此外,项目得到 NumFOCUS、PyMC Labs 等组织赞助并鼓励社区参与与贡献。
Stan 是一个用于贝叶斯数据分析的概率编程框架和工具链,支持从简单回归到复杂层级模型和时间序列的广泛建模需求。它提供了高效的采样与推断算法,使得在复杂数据结构下也能得到可解释且稳健的后验分布结果。Stan 同时具备多语言接口(如 R、Python、Julia 和命令行),便于在笔记本、计算集群或云端环境中集成与部署。其丰富的文档、教程和社区支持帮助用户在模型构建、验证与可视化方面快速上手并提升建模质量。
FlowingData 是一个专注于数据可视化与统计思想的博客与资源汇总平台,长期发布关于图表、地图、信息图、统计可视化和数据分析的深度短文与精选链接。站点由数据可视化领域的实践者维护,既有对新闻可视化作品的点评,也有教程、工具与数据集推荐,包含付费会员专栏“Process”系列。内容风格兼顾实用性与审美,既适合数据科学家、可视化设计师和研究者,也对希望以图表理解世界的普通读者友好,文章类型覆盖案例展示、方法讨论、工具盘点和主题策展。