computervision

按标签浏览

Midjourney

Midjourney 是一家社区资助的研究实验室，团队约 60 人，专注于构建高质量且具有美学追求的人工智能模型，尤其以图像与视频生成见长。其理念围绕“midjourney”这一隐喻，强调人类处于既有过去又面向未来的过程，致力于探索我们想成为什么样的人以及技术如何助力这一过程。网站展示了多项正在推进的项目，涵盖想象力、协作、反思、美学与人类繁荣等主题，并计划在未来推出更多软件和硬件产品。Midjourney 强调社区参与与协作，主要通过 Discord 社区提供产品支持与交流，同时提供文档、帮助页面和招聘信息，面向开发者、艺术家与研究者开放。

生成式 AI 计算机视觉提示词工程社区

Luma AI

生成艺术计算机视觉数字时尚

Luma AI 是一家专注于多模态生成与理解的人工智能公司，目标是构建能够在物理世界中生成、理解与操作的多模态通用智能。其产品线包括面向创意生产的 Dream Machine、用于高保真视频生成的 Ray3、以及高效图像生成模型 Photon，同时提供开放的 Luma API 以便开发者将图像与视频生成功能集成到应用中。Luma AI 强调生产级别的质量、速度与可控性，适用于影视制作、广告创意、教育与企业级部署等场景，并通过 Learning Hub、Creative Partner Program 和社区渠道支持创作者与教育者。公司同时发布研究报告和模型评估，推动视频与图像生成领域的技术前沿。

生成式 AI 计算机视觉视频 AI 应用程序接口开发

Plask

现实捕捉人工智能虚拟制作 3D 资产生成

Plask 是一款基于人工智能的 3D 动作捕捉与动画生成工具，可以将任意视频快速转换为专业级的 3D 动画。用户只需上传手机或在线视频，Plask 的 AI 即可从单摄像头素材中提取精确的动作数据，并将其应用到 MMD、VRM 等 3D 模型上，支持眨眼与物理模拟。平台提供便捷的机位与灯光控制、电影级后期效果（如运动模糊与景深），并能导出兼容 Unreal、Maya、Blender、Unity 等主流软件的 3D 资源或直接渲染高质量视频。Plask 同时面向专业团队与初学者，提供网页端云服务、快速渲染与定制化短视频制作服务，适用于游戏开发、影视制作与社交媒体内容创作。

计算机视觉视频 AI 建模平台工具

Flow Studio

虚拟制作 3D 资产生成程序动画

Autodesk Flow Studio（前身为 Wonder Studio）是一款基于云端的 AI 驱动 3D VFX 工具，能够将实拍素材快速转换为可编辑的 CG 场景，适合独立创作者与专业视觉特效团队使用。它提供从**无标记动作捕捉**到**视频转 3D 场景**、逐帧可编辑的导出元素，并支持 USD/FBX 等开放标准，便于与 Maya、Blender、Unreal 等主流工具无缝集成。Flow Studio 使用按秒计费的积分系统和多档订阅（含免费层级），并提供云渲染以提高制作效率；企业级方案还支持大规模存储、更多角色上传和 AI 数据选择退出等高级控制。总体来说，它把复杂的 VFX 流程简化为可控、可导出的制作步骤，帮助艺术家专注创作而非繁琐技术细节。

计算机视觉视频 AI 生成式 AI 追踪云计算

DeepMotion

数字时尚 3D 资产生成程序动画

DeepMotion 是一家专注于将数字人和角色动画通过 AI 技术“带入生活”的公司，提供基于视频和文本的 3D 动画生成与动作捕捉解决方案。其产品线包括基于文本生成 3D 动画的 SayMotion、以及将视频转换为 3D 动画的 Animate 3D，并通过 API 方便集成到开发者与企业的工作流中。平台强调无需昂贵硬件即可完成快速、高质量的动作捕捉与重定位（retargeting），支持面部捕捉、骨骼动画导出以及与引擎（如 UE5）和常见 3D 工具的兼容。DeepMotion 同时与多家行业与学术机构合作（如 Samsung、Nvidia、Intel、Epic、MIT 等），面向游戏开发者、XR/AR 艺术家、影视制作人和教学科研等多种场景，降低了动作动画的门槛并提升制作效率。

人工智能生成式 AI 计算机视觉应用程序接口

NovelAI

生成艺术创意写作人工智能自然语言处理与文本

NovelAI 是一款面向创作者的 AI 平台，主打动漫风格的图像生成与互动式写作辅助。平台提供最新的文本模型（如 GLM-4.6）以支持更长上下文、多语言和更强的叙事能力，同时拥有专门优化的图像生成器、编辑器和多种高级设置，便于用户精细控制输出效果。NovelAI 支持 Image2Image、Inpaint、Vibe Transfer 等功能，并提供标签化提示系统、随机提示与多角色提示管理，帮助用户快速产生稳定且多样化的创作结果。其商业模式包含免费试用、月订阅与按次付费选项，配合社区、博客与支持文档，适合从入门到进阶的数字艺术家与写手使用。

生成式人工智能提示词工程写作计算机视觉设计

Lalaland

数字时尚虚拟制作 3D 资产生成

Lalaland 是一种面向 B2B 与电商场景的定制化 AI 模型技术（现已被 Browzwear 并入），用于在没有实物样品或摄影棚拍摄的情况下，生成逼真且符合品牌调性的模特图像。该技术能够快速创建品牌专属、风格一致且多样化的虚拟模特，支持参数化身材、肤色、发型、表情与动态姿势等细节控制，便于在商品审批、批发展示、线上商品页和市场活动中提前展示产品。通过与 Browzwear 的数字化工作流深度整合，团队可以显著缩短上市时间、节省拍摄与差旅成本，并在全球范围内保持品牌视觉一致性与知识产权控制。该方案适用于商品验证、虚拟试穿、本地化营销与协同审批等多种场景，帮助企业提高转化率并加速决策流转。

生成式人工智能生成式 AI 计算机视觉电子商务图形

Kaedim

3D 资产生成数字时尚

Kaedim 是一家面向专业 3D 团队的 AI 驱动平台，结合机器学习速度与人工质检，生成可直接投入生产流水线的 3D 资产。它主打“10× 加速 3D 制作”和“生产就绪（production-ready）”的交付标准，适用于游戏、消费品设计、电商与零售等场景。Kaedim 提供定制化风格训练、可按需扩缩的产能、企业级安全与合规支持，并声称能将 3D 制作成本降低最多达 90%，帮助团队保持既有工具链和工作流程的同时显著提升产能与迭代速度。

生成式人工智能计算机视觉建模隐私工作流

OpenMMLab

计算机视觉深度学习 MLOps 工程

OpenMMLab 是一个面向计算机视觉领域的开源生态与工具集合，汇聚了大量由社区维护的算法库、模型以及配套工具，覆盖目标检测、语义分割、姿态估计、视频理解、3D 检测、图像生成等研究与工程任务。官网展示了丰富的代码库（如 MMDetection、MMSegmentation、MMPose、MMEngine 等）与箱式工具（toolbox），并提供文档、基准测试与示例代码，方便科研复现与工业部署。社区活跃，拥有大量贡献者、星标与合作机构，支持多语言文档与交流渠道，是视觉领域快速上手、复现论文与构建工程系统的重要平台。

计算机视觉深度学习开源机器学习工具

Ultralytics

计算机视觉 MLOps 工程低代码人工智能

Ultralytics 是一家专注于计算机视觉与物体检测的公司，核心产品包括开源的 Ultralytics YOLO 模型库和面向企业与个人的无代码平台 Ultralytics HUB。该网站展示了从数据上传、模型训练到模型导出与部署的一体化工作流，支持多种导出格式（如 TensorFlow、ONNX、CoreML 等），并可在移动设备与云端运行。Ultralytics 同时以开源社区驱动，拥有活跃的 GitHub 项目与大量星标，面向初创企业、科研机构、开发者与爱好者提供不同层级的解决方案与企业授权。网站还展示了客户案例、合作伙伴与行业信任标识，强调易用性、可扩展性和行业落地能力。

计算机视觉检测开源无代码平台

Viso

计算机视觉 MLOps 工程视觉检测人工智能

Viso 是一家面向企业的视觉AI平台，核心产品为 Viso Suite，提供端到端的计算机视觉基础设施，帮助企业将摄像头数据转化为可操作的实时洞察。平台支持快速部署与扩展，兼容现有摄像头与系统，强调企业级安全与隐私合规，旨在缩短从概念到投产的时间并降低总体拥有成本。Viso Suite 包含即用型视觉应用、模型训练与数据管理工具、边缘与云端部署能力，广泛应用于制造、建筑、物流、能源与零售等行业，用例包括 PPE 检测、危险区域识别、物体计数与预测性维护等。通过集中化的平台管理与自动化运维，Viso 助力企业实现更高的运营效率与安全性，同时支持持续学习与模型优化以提升长期价值。

计算机视觉视频 AI 平台物联网隐私

Albumentations

计算机视觉深度学习机器学习

Albumentations 是一个面向计算机视觉的图像增强库，旨在通过高效、可扩展的增强方法提升深度神经网络在有限数据下的表现。它提供了丰富的变换集合（像素级与空间级）、对不同目标类型（图像、分割掩码、边界框、关键点等）的统一支持，以及与 PyTorch、TensorFlow 等主流框架的无缝集成。该库强调性能与可复现性，支持 YAML/JSON 序列化增强管道并提供基准测试以验证开销最小化的实现。在科研、工业、竞赛（如 Kaggle）和开源项目中被广泛采用，并由多个大厂与研究机构信赖与引用。

计算机视觉深度学习机器学习开源 Python

LearnOpenCV

计算机视觉深度学习 MLOps 工程

LearnOpenCV 是由 Satya Mallick 创建的计算机视觉与深度学习学习平台，聚焦于 OpenCV、PyTorch、TensorFlow 以及视觉-语言模型（VLM）等前沿技术。网站提供大量实战教程、代码示例、论文解读与应用指南，涵盖图像处理、目标检测、语义分割、3D 重建与模型部署等主题。同时提供多门免费的入门与进阶课程（如 OpenCV Crash Course、VLM Bootcamp、TensorFlow/PyTorch Bootcamps）以及证书学习路径，适合学生、研究者与工程师快速上手并将模型部署到实际项目中。内容兼顾理论与工程实现，常配有 C++ 与 Python 示例代码、安装指南与实用工具，社区与订阅服务帮助持续获取更新。

计算机视觉深度学习 Python 开源培训

PyImageSearch

计算机视觉深度学习 MLOps 工程

PyImageSearch 是由 Adrian Rosebrock 博士创办的计算机视觉与深度学习学习与实战平台，专注于将复杂的理论转化为可操作的实践教程与课程。网站提供大量面向初学者与进阶开发者的免费教程、每周更新的技术文章、以及系统化的付费课程与书籍，如《Deep Learning for Computer Vision with Python》和 PyImageSearch University。平台内容覆盖 OpenCV、目标检测（如 YOLO 系列）、人脸应用、嵌入式设备（Raspberry Pi、Jetson 等）及模型部署实务，强调代码示例、Colab 笔记本与工程化实践。无论是自学入门还是企业级落地，PyImageSearch 都提供循序渐进且高度实用的学习路径与社区支持。

计算机视觉深度学习 Python 开发检测

MIT CSAIL

机器学习深度学习计算机视觉

MIT CSAIL（麻省理工学院计算机科学与人工智能实验室）是世界领先的计算机科学与人工智能研究机构，汇聚了大量教授、研究人员和学生，覆盖从人工智能与机器学习到人机交互、编程语言与软件工程等广泛领域。该网站展示了科研项目、团队成员、新闻报道和视频资料，便于公众、学者与产业界了解最新研究进展与合作机会。CSAIL 强调跨学科合作与技术转化，推动基础研究向现实世界应用落地，同时提供教育与公开资源以支持学术交流与人才培养。网站内容结构清晰，包含项目目录、研究小组、新闻动态和多媒体档案，适合检索与跟踪前沿科研成果。

学术人工智能研究深度学习计算机视觉

Google AI

人工智能助理提示词工程

ai.google（Google AI）是谷歌面向公众展示其人工智能产品、能力与示例应用的官方页面。页面汇集了多种AI工具与服务的介绍与演示，包括最新的Gemini模型系列、图像编辑与生成功能（如Nano Banana）、视频与场景创作工具（Veo/Flow）、以及以研究与学习为导向的NotebookLM等。网站通过丰富的示例提示（prompts）、可交互链接和演示视频，展示了从创意内容生成、图像修复、旅行与学习规划到生产力插件等多领域的应用，同时标注了部分功能需要登录或订阅才能使用。总体上它既是产品集合页，也是面向开发者、创作者和普通用户的功能指南与灵感库。

生成式 AI 提示词工程计算机视觉生产力

Functionize

Functionize 是一家以 AI 为核心的企业级测试自动化平台，主打“智能代理（Agentic AI）”驱动的端到端测试能力，旨在消除传统测试脚本的脆弱性和持续维护负担。平台通过多年企业级训练和大量页面数据，实现接近 99.97% 的元素识别准确率，并宣称可将测试维护成本减少约 80%，大幅提升回归测试和发布速度。其云优先架构支持无状态容器化代理并行执行数千个测试，用于跨浏览器、设备与地域的大规模测试执行。Functionize 还提供可视化回归、测试自愈、诊断与优化功能，帮助非技术团队在数秒内创建测试并将人工测试人员转型为自动化专家，适合追求快速发布与高质量交付的企业级团队。

自动化测试云计算计算机视觉平台

Wild Me

生物多样性人工智能计算机视觉深度学习

Wild Me 是由 Conservation X Labs 支持的开源项目与平台生态，致力于将机器学习与软件工程应用于野生动物保护与科研。该网站介绍了多个面向物种识别与种群监测的工具与平台（如 Wildbook、Scout、Fin Finder 等），并提供代码、文档、服务以及社区支持。Wild Me 强调长期数据管理、跨区域协作与高性能的 AI 处理能力，支持研究者进行自动化个体识别、种群评估与科研出版。网站同时提供捐赠与合作途径，汇集研究成果与社区案例，推动基于人工智能的保护实践落地。

计算机视觉深度学习开源生物识别追踪

Reconstruct

数字孪生技术现实捕捉人工智能设施管理人工智能

Reconstruct 是一家专注于建筑施工现场的远程质量控制与进度监测的技术公司，提供基于现实映射与摄影测量的数字孪生解决方案。其平台能将现场拍摄的照片与视频自动定位并生成可测量的二维平面图与三维模型，支持从智能手机、360 相机到无人机等多种采集设备。通过与设计图纸和施工进度的叠加对比，用户可以远程发现问题、减少返工并优化协调流程，从而节省差旅与时间成本。Reconstruct 同时提供 4D BIM 可视化、在线竣工档案以及协作标注等功能，适用于业主、总承包商与项目代表等不同角色。

数字孪生计算机视觉可视化建模监控

GeoSLAM

现实捕捉人工智能数字孪生技术 3D 打印房屋

GeoSLAM 是一家专注于手持与移动测绘解决方案的品牌，现已并入 FARO，相关资源与支持页面已整合到 FARO 的网站和学习平台中。网站列出了包括 ZEB 系列（如 ZEB Horizon、ZEB Revo RT、ZEB Discovery、ZEB Go 等）在内的移动扫描器产品线，以及用于点云处理与清理的 FARO Connect（原 GeoSLAM Connect）和首款混合移动测绘设备 FARO Orbis。除此之外，页面还提供技术支持、知识库、GeoSLAM Academy（已迁移至 FARO Academy）与授权经销商联系渠道，方便用户获取培训、文档和售后服务。历史时间轴回顾了 GeoSLAM 自 2013 年推出 ZEB1 起的多项里程碑，展示了产品演进与与 FARO 合并后的协同发展前景。

计算机视觉数字孪生地图建模可视化

Leica Geosystems（徕卡地理系统）

现实捕捉人工智能数字孪生技术工业物联网

Leica Geosystems 是一家专注于高精度测量与三维空间数据采集的知名品牌，提供从全站仪、智能天线到激光扫描仪及配套软件的完整解决方案。页面展示了多款代表性产品，如 Leica TS20 机器人全站仪、AI 驱动的 Leica iCON trades、以及轻量级的 Leica GS05 智能天线，并强调产品的生产力、安全性与互操作性。网站还介绍了 GeoCloud Protect 设备安全服务、Leica SmartPole 等系统集成方案，以及与 Cyclone、BLK360 等现实捕捉软件/硬件的联动，体现了面向工程测量、建筑布局与地理空间数据处理的应用深度与生态优势。

计算机视觉建模物联网基础设施

NavVis

数字孪生技术现实捕捉人工智能工业物联网

NavVis 是一家专注于现实捕获（reality capture）与数字孪生（digital twin）技术的公司，提供端到端的硬件与软件解决方案以采集、处理并在线访问高精度点云与全景图像。其产品线包括用于现场采集的 **NavVis LX-Series** 移动测量设备、用于数据处理与配准的 **IVION Processing**，以及用于可视化与协作的云服务 **NavVis IVION**。NavVis 的核心优势在于基于 SLAM 的高精度定位与测量、无缝的工作流集成以及面向工程、施工、工厂与基础设施等多行业的应用场景。官方网站还提供样例数据、案例研究、白皮书与线上研讨会，支持用户快速上手并评估解决方案在实际项目中的价值。

数字孪生计算机视觉可视化工程集成

FARO

现实捕捉人工智能数字孪生技术设施管理人工智能

FARO 是一家专注于三维测量、成像与数字化现实解决方案的全球性公司，提供从便携式手持扫描仪到高精度臂式测量系统的硬件与配套软件。其产品广泛应用于3D计量、建筑工程（AEC）、公共安全、法医现场勘查、制造检测与数字孪生等领域，旨在通过高精度数据减少返工、降低成本并提升决策速度。FARO 强调便携性与测量精度，代表产品包括 HandySCAN、Quantum/FaroArms 等，并通过与 Creaform、Virtek 等合作或并入 AMETEK 的业务矩阵，扩展技术与市场覆盖。无论是质量控制、生产装配、建筑测量还是事故现场重建，FARO 提供端到端的测绘、扫描与分析能力，帮助用户把现实世界的几何信息高效转化为可用的数据资产。

数字孪生建模工程计算机视觉可视化

Tevel

农业机器人精准农业自主移动机器人

Tevel 是一家专注于果园收获自动化的科技公司，核心产品为“飞行自主机器人”（Flying Autonomous Robots™），通过人工智能、计算机视觉与机器学习实现果实的精准采摘与分拣。其系统可判断果实成熟度并进行选择性采摘，减少碰伤并提升果品质量，同时支持实时数据采集与远程监控，帮助农场优化分拣、计量与追溯流程。Tevel 已在意大利、美国、智利、以色列等地开展试点与合作，获得多项农业与机器人领域的奖项与投资支持，并由具有丰富研发与行业经验的团队领导运营。该方案主打提高效率、降低人工成本、实现全天候作业和可量化的产量数据，为果树种植者提供技术驱动的收获解决方案。

计算机视觉自动化机器人技术数据库物联网

computervision

按标签浏览

Midjourney

Luma AI

Plask

Flow Studio

DeepMotion

NovelAI

Lalaland

Kaedim

OpenMMLab

Ultralytics

Viso

Albumentations

LearnOpenCV

PyImageSearch

MIT CSAIL

Google AI

Functionize

Wild Me

Reconstruct

GeoSLAM

Leica Geosystems（徕卡地理系统）

NavVis

FARO

Tevel

全部

学术

人工智能

算法

分析

应用程序接口

音频

审计

自动化

亚马逊云科技

银行

生物信息学

生物学

生物识别

认证

云计算

编码

协作

社区

计算机视觉

内容

客户体验

数据

数据库

深度学习

设计

检测

开发

数字孪生

电子商务

教育科技

工程

企业

伦理

金融科技

预测

欺诈

生成式 AI

生成式人工智能

基因组学

全球化

谷歌

治理

图形

医疗健康

基础设施

创新

集成

物联网

法律科技

机器学习

管理

地图

营销