计算机视觉：让机器“看”懂世界

计算机视觉：让机器“看”懂世界

计算机视觉（Computer Vision）是 AI 中负责图像和视频分析的分支，目标是让机器能识别、理解和处理视觉信息。

核心任务包括：

图像分类（猫 or 狗）
目标检测（图中有几辆车？在哪里？）
图像分割（精确轮廓划分）
人脸识别、姿态识别、动作识别等

背后的技术多基于 CNN（卷积神经网络）模型，也结合了 transformer 架构以提升精度。

现实应用包括人脸解锁、安防监控、医学影像诊断、自动驾驶等场景。视觉是人类认知的重要入口，赋予 AI 视觉，就像给机器装上了“眼睛”。