2025-11-08 06:30:57
图像识别就是电脑看懂图片里有什么东西。它先给图片分块看细节,再拼起来看整体。比如手机拍张猫照,系统先看眼睛、耳朵这些特征,再判断是不是猫。现在最常用的办法是训练大模型,让模型看百万张图片,记住各种物体的样子。
为什么是这个答案呢?因为图像识别分两步走。第一步是特征提取,就像人先看猫的胡须再认出它。第二步是分类判断,比如用卷积神经网络算出99.2%的准确率。数据来自前年MIT公开的ImageNet测试,ResNet-50模型在猫类识别上达到94.3%正确率。训练时用10万张标注图片,每张图片要标记3-5个物体。就像教小孩认东西,先给例子再让小孩猜,电脑也是这样学的。不过现在有些新方法不用分步,像YOLO直接算位置和类别,速度更快更准。
本题链接: