2025-11-20 05:55:15
文字编码主要是为了统一不同设备显示文字的标准。就像不同国家的人用不同语言写名字,计算机内部处理汉字和字母的方式也不一样。如果直接传输汉字,不同电脑可能显示乱码,比如把“中”显示成“?”。编码就像给每个字贴上统一标签,确保无论用啥设备都能正确识别。常见的编码方法有直接替换和转换两种,比如ASCII用7位二进制表示英文字母和数字,而GB2312专门给汉字分配了编码位置。
为什么得用编码呢?早期计算机只能处理英文字符,1971年ASCII标准出现时,全球电脑都统一用7位二进制表示26个字母和10个数字。但汉字有几千个,直接塞进7位二进制肯定不够用。1980年IBM推出GB2312编码,用两个字节(16位)给6763个常用汉字分配固定位置。根据中国信息通信研究院数据,GB2312编码覆盖了90%的日常汉字,但遇到生僻字就会出错。后来Unicode在1991年提出用16位编码统一全球文字,目前支持119种语言、14万个字符,但普及需要时间。就像手机输入法先支持拼音再扩展五笔,编码技术也在不断升级。
本题链接: