计算机视觉:让机器“看”懂世界
计算机视觉(Computer Vision)是 AI 中负责图像和视频分析的分支,目标是让机器能识别、理解和处理视觉信息。
核心任务包括:
-
图像分类(猫 or 狗)
-
目标检测(图中有几辆车?在哪里?)
-
图像分割(精确轮廓划分)
-
人脸识别、姿态识别、动作识别等
背后的技术多基于 CNN(卷积神经网络)模型,也结合了 transformer 架构以提升精度。
现实应用包括人脸解锁、安防监控、医学影像诊断、自动驾驶等场景。视觉是人类认知的重要入口,赋予 AI 视觉,就像给机器装上了“眼睛”。