2025-11-20 07:17:29
一个汉字通常占两字节,像“好”这样的字在电脑里存两字节。现在电脑文件都是二进制码存储的,两字节刚好能表示所有简体字。比如GB2312编码里,每个字对应两个八位数字符,合起来16位刚好存完所有简体汉字。
为什么是两字节?因为GB2312编码是把每个汉字拆成两个字节,一个字节存高位,一个字节存低位。比如“中”字的高位字节是D6,低位是F4,合起来就是D6F4。现在电脑存储都是按字节对齐的,两字节刚好能覆盖所有简体字。虽然Unicode UTF-8是三字节,但国内普遍用GB2312,所以一般说两字节。比如存100个字,就是200字节。不过有时候系统会加空格或换行,实际占点多。比如存“你好”两字,就是4字节,但显示出来可能占3行,实际存储还是4字节。
本题链接: