2025-11-21 01:39:48
最近刷到《》这段视频发现字幕总对不上,可能因为主播用方言讲台词。自动识别系统能识别70%的普通话,遇到吴语、粤语或专业术语就卡壳。比如“侬”这种上海话发音,识别成“你”就错位了。还有视频里突然出现的古诗词,AI根本分不清是台词还是背景字幕。
为啥是这个理呢?先说自动识别的硬伤。现在主流的ASR系统准确率也就75%左右,遇到连读、叠词、方言词就翻车。比如“侬今朝穿啥衣服”识别成“你今天穿啥衣服”,但“侬”和“你”发音完全不同。再查数据,B站前年测试显示,方言视频字幕错位率高达43%,古诗词识别错误率超60%。比如视频里突然冒出“关关雎鸠”,AI根本分不清是台词还是背景字幕,直接生成乱码。更别提主播边跳边喊的“哎哟喂”,识别成“哎哟喂”和“哎哟喂”其实差三个音节,但AI听不出来。所以字幕总慢半拍,要么漏词要么错字,就像看电视剧没带字幕,光看画面根本看不懂。
本题链接: