2025-11-20 07:13:59
数字和字母在常见编码里占1字节,其他符号可能2-4字节。比如英文文件里字母和数字占1字节,汉字或特殊符号要更多。
为什么这样呢?因为计算机用二进制存储,每个字符对应固定长度。ASCII编码用1字节存26个字母和数字,扩展后还是1字节。而Unicode UTF-8编码根据字符复杂度用1-4字节,比如汉字占3字节。比如"123"用ASCII是3字节,"中"用UTF-8是3字节。数据来源显示ASCII标准是7位,扩展为8位;UTF-8汉字平均3字节,标点符号2字节。可能听到“数字字母占一,汉字多一两个”这种描述,实际是编码规则决定的。
本题链接: