Unicode CJK一部分编码笔记

Unicode CJK部分编码笔记

首先请关注 http://zh.wikibooks.org/wiki/Unicode 直观对照,下面是范围的解释
他的应用就不说了,基础设施呀。

本来要带上例子字符的,可ITEYE发不上,没办法了。

全部Unicode中日韩越通用汉字字符(约76227字)。
定义            范围                   字数
CJK基本集    [4E00-9FBB]      20924字
                   [9FC3-9FCB]              8字
CJK扩展A     [3400-4DB5]       6582字
CJK扩展B     [20000-2A6D6] 42711字
CJK扩展C   [2A700-2B734]   4149字
CJK扩展D   [2A740-2B81D]     222字

部首扩展      [2E80-2EF3]        115字
康熙部首      [2F00-2FD5]        214字
IDS符号       [2FF0-2FFB]          12字
CJK符号      [3000-303F]          64字
日文假名      [3040-30FF]        189字
CJK注音符号 [3105-312C]         40字
CJK笔画       [31C0-31E3]         36字
全角符号      [FF01-FF60]           96字

CJK兼容        [F900-FAD9]        474字
CJK兼容扩展  [2F800-2FA1D]    542字
PUA(GBK) [E815-E864]          79字


更详细的解释,其实有些是保留的,目的不外乎扩容准备

中日韩字符范围2E80~9FFF

2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。

3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。

4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。

A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。

AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。

F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。

FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角符号等。

对应官方文档

标准CJK文字
http://www.unicode.org/Public/UNIDATA/Unihan.html

全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
http://www.unicode.org/charts/PDF/UFF00.pdf


CJK部首补充:2E80-2EFF
http://www.unicode.org/charts/PDF/U2E80.pdf


CJK标点符号:3000-303F
http://www.unicode.org/charts/PDF/U3000.pdf


CJK笔划:31C0-31EF
http://www.unicode.org/charts/PDF/U31C0.pdf


康熙部首:2F00-2FDF

http://www.unicode.org/charts/PDF/U2F00.pdf


汉字结构描述字符:2FF0-2FFF
http://www.unicode.org/charts/PDF/U2FF0.pdf


注音符号:3100-312F
http://www.unicode.org/charts/PDF/U3100.pdf


注音符号(闽南语、客家语扩展):31A0-31BF
http://www.unicode.org/charts/PDF/U31A0.pdf


日文平假名:3040-309F
http://www.unicode.org/charts/PDF/U3040.pdf


日文片假名:30A0-30FF
http://www.unicode.org/charts/PDF/U30A0.pdf


日文片假名拼音扩展:31F0-31FF
http://www.unicode.org/charts/PDF/U31F0.pdf


韩文拼音:AC00-D7AF
http://www.unicode.org/charts/PDF/UAC00.pdf


韩文字母:1100-11FF
http://www.unicode.org/charts/PDF/U1100.pdf


韩文兼容字母:3130-318F
http://www.unicode.org/charts/PDF/U3130.pdf


太玄经符号:1D300-1D35F
http://www.unicode.org/charts/PDF/U1D300.pdf


易经六十四卦象:4DC0-4DFF
http://www.unicode.org/charts/PDF/U4DC0.pdf


彝文音节:A000-A48F
http://www.unicode.org/charts/PDF/UA000.pdf


彝文部首:A490-A4CF
http://www.unicode.org/charts/PDF/UA490.pdf


盲文符号:2800-28FF
http://www.unicode.org/charts/PDF/U2800.pdf


CJK字母及月份:3200-32FF
http://www.unicode.org/charts/PDF/U3200.pdf


CJK特殊符号(日期合并):3300-33FF
http://www.unicode.org/charts/PDF/U3300.pdf


装饰符号(非CJK专用):2700-27BF
http://www.unicode.org/charts/PDF/U2700.pdf


杂项符号(非CJK专用):2600-26FF
http://www.unicode.org/charts/PDF/U2600.pdf


中文竖排标点:FE10-FE1F
http://www.unicode.org/charts/PDF/UFE10.pdf


CJK兼容符号(竖排变体、下划线、顿号):FE30-FE4F
http://www.unicode.org/charts/PDF/UFE30.pdf