多年来一直疑惑!究竟为什么汉字要占 2 个字节的存储空间?是不是这么回事?发表一下您的看法。该如何解决
多年来一直疑惑!究竟为什么汉字要占 2 个字节的存储空间?是不是这么回事?发表一下您的看法。
我认为:
因为存储汉字要采用 Unicode 字符编码,而 Unicode 字符编码就是占用 2 个字节的存储空间,究竟是不是这么回事?
--------------------------------------------------
而我在百度上搜索的答案是:
我国规定的汉字代码标准GB2312-80为6763个常用汉字规定了二进制代码,每个汉字占用2个字节,就是16个BYTE。近年来开始使用的新的国家标准GB13000,使用四个字节表示一个汉字,统一表示20902个汉字。
------解决方案--------------------
总之一个字节是无法表示出完整的汉字集的。
------解决方案--------------------
我想跟汉字的多少有直接的关系,英文(A~Z)区区26个字母加上常用的符号用计数的方式仅仅用256个数字就可表示了,而汉字是一种框架结构有两万多之巨,仅从字形上来说联系不大,因此要用计数查表的方式来表示自然需要65535即两个字节来表示。(个人愚见,不对之处请指教)
------解决方案--------------------
Unicode标准有utf8,utf16,utf32等多种不同的编码方式
------解决方案--------------------
我觉得你把因果颠倒了,个人看法
------解决方案--------------------
一个字节8位,只能表示2^8个数,也就是256,你不会认为汉字只有256个吧(这个还没有减去ascii的128个字符)
------解决方案--------------------
Unicode GBxxxx是不同的编码。
Unicode!=汉字编码,他的范围涵盖了世界上大多数正在使用的字符集,这个从名字上就能看出,Unicode希望是提供一种“唯一”的通用的,在任何地区都能使用的编码。
汉字占2个字节这种说法最早的来源来自GB2312编码和Big5编码流行的那个年代……这个年代非常久远了,当年偶应该专门翻过,如今用google意思一下……
我认为:
因为存储汉字要采用 Unicode 字符编码,而 Unicode 字符编码就是占用 2 个字节的存储空间,究竟是不是这么回事?
--------------------------------------------------
而我在百度上搜索的答案是:
我国规定的汉字代码标准GB2312-80为6763个常用汉字规定了二进制代码,每个汉字占用2个字节,就是16个BYTE。近年来开始使用的新的国家标准GB13000,使用四个字节表示一个汉字,统一表示20902个汉字。
------解决方案--------------------
总之一个字节是无法表示出完整的汉字集的。
------解决方案--------------------
我想跟汉字的多少有直接的关系,英文(A~Z)区区26个字母加上常用的符号用计数的方式仅仅用256个数字就可表示了,而汉字是一种框架结构有两万多之巨,仅从字形上来说联系不大,因此要用计数查表的方式来表示自然需要65535即两个字节来表示。(个人愚见,不对之处请指教)
------解决方案--------------------
Unicode标准有utf8,utf16,utf32等多种不同的编码方式
------解决方案--------------------
我觉得你把因果颠倒了,个人看法
------解决方案--------------------
一个字节8位,只能表示2^8个数,也就是256,你不会认为汉字只有256个吧(这个还没有减去ascii的128个字符)
------解决方案--------------------
Unicode GBxxxx是不同的编码。
Unicode!=汉字编码,他的范围涵盖了世界上大多数正在使用的字符集,这个从名字上就能看出,Unicode希望是提供一种“唯一”的通用的,在任何地区都能使用的编码。
汉字占2个字节这种说法最早的来源来自GB2312编码和Big5编码流行的那个年代……这个年代非常久远了,当年偶应该专门翻过,如今用google意思一下……