礼品代发网

礼品代发网

收录130107113题,礼品代发网免费搜题解答

今日已更新0道题

哪些编码支持中文-支持中文编码的字符编码

2025-11-20 05:52:39  

哪些编码支持中文-支持中文编码的字符编码

优质解答

中文主要用GB2312、GBK、UTF-8三种编码。GB2312是90年代国家定制的,覆盖常用汉字和符号,但字库小只能装6763个字。GBK是GB2312的升级版,字库扩大到2万字,能兼容更多生僻字。UTF-8是国际通用的,一个汉字占3个字节,虽然占内存大,但能支持所有Unicode字符,现在几乎成标准了。

为啥选这三种呢?首先看历史,GB2312是中文编码的起点,早期Windows系统都认它。但90年代末发现它字库不够,GBK就出来了,解决了生僻字问题。到2000年左右,Unicode成为国际标准,UTF-8凭借跨平台优势迅速流行。数据说话:GB2312有6763字,GBK有2万字,UTF-8能装10万+汉字。Windows早期用GBK,Linux用UTF-8,现在大部分网站和编程语言都默认UTF-8。比如Python写文件时如果不指定编码,默认就是UTF-8,否则会报错。还有个关键点, UTF-8兼容性最好,比如用GB2312保存的文件,用UTF-8打开还能读,反过来不行。所以现在新系统都弃用老编码,改用UTF-8了。但老文件还是得看编码类型,比如Excel里保存的表格,用错编码就显示乱码了。

本题链接:

中文编码常见格式