计算机视觉:让机器“看”懂世界

计算机视觉(Computer Vision)是 AI 中负责图像和视频分析的分支,目标是让机器能识别、理解和处理视觉信息。

核心任务包括:

  • 图像分类(猫 or 狗)

  • 目标检测(图中有几辆车?在哪里?)

  • 图像分割(精确轮廓划分)

  • 人脸识别、姿态识别、动作识别等

背后的技术多基于 CNN(卷积神经网络)模型,也结合了 transformer 架构以提升精度。

现实应用包括人脸解锁、安防监控、医学影像诊断、自动驾驶等场景。视觉是人类认知的重要入口,赋予 AI 视觉,就像给机器装上了“眼睛”。