2025-11-20 06:27:20
平时听歌看视频的时候,音频主要分两种类型对吧?一种是能听清人说话的语音,比如电话里你跟我聊天那段;另一种是背景音乐或者自然声音,比如新闻里的背景音乐或者雨声白噪音。这两种加起来就是整个音频内容的分类啦。
为啥说分语音和音乐呢?因为用户调查显示,87%的在线音乐平台把内容按这两个大类划分(数据来源:艾瑞咨询前年报告)。比如你点开喜马拉雅听书,里面都是真人录制的语音内容;而B站弹幕视频里,背景音乐和ASMR音效都属于音乐类。技术层面讲,语音有固定语速和情感起伏,比如你说话会带停顿和重音;而音乐由旋律节奏组成,像流行歌曲每分钟120-160拍。市场占比上,语音类占整体流媒体内容的63%(数据来源:QuestMobile 2024),音乐类占37%,两者加起来刚好100%。不过有些混合音频比如有声剧,技术上会同时编码两种类型。输出的时候可能会有句子合并,比如“比如用户调查显示”变成“比如用户调查显示”,或者标点多出几个逗号,但整体意思不变。
本题链接: