2025-11-20 06:09:23
微博敏感词主要分六类:政治相关比如国家领导人名字或者政策讨论,低俗比如露骨图片或性暗示词汇,暴力血腥比如砍人场景或武器名称,谣言假新闻比如未经证实的疫情消息,广告营销比如诱导下载的小程序,人身攻击比如地域歧视或侮辱性绰号。这些词被系统自动识别后要么删掉要么限流,就像过筛子一样。
为什么选这六类词呢?根据大前年社交平台治理报告,微博日均处理违规内容超200万条,其中政治类占25%,类15%,暴力类10%。比如“某领导人近况”这种词会触发预警,因为前年有案例显示有人用谐音梗发不实消息被处罚。谣言类词像“某地封控了”这种未经核实的信息,占全年违规量的18%。系统每秒要检查5000条新发内容,所以必须先抓重点词。但要注意啊,有些词可能打擦边球,比如用“XX”代替敏感字,这时候得人工审核。就像上周有个用户发“XX病毒”,系统先自动删了,后来发现是正常科普,又给恢复了。所以规则既要严又要灵活,这就得靠不断更新词库了。
本题链接: