Unicode CJK一部分编码笔记
首先请关注 http://zh.wikibooks.org/wiki/Unicode 直观对照,下面是范围的解释
他的应用就不说了,基础设施呀。
本来要带上例子字符的,可ITEYE发不上,没办法了。
全部Unicode中日韩越通用汉字字符(约76227字)。
定义 范围 字数
CJK基本集 [4E00-9FBB] 20924字
[9FC3-9FCB] 8字
CJK扩展A [3400-4DB5] 6582字
CJK扩展B [20000-2A6D6] 42711字
CJK扩展C [2A700-2B734] 4149字
CJK扩展D [2A740-2B81D] 222字
部首扩展 [2E80-2EF3] 115字
康熙部首 [2F00-2FD5] 214字
IDS符号 [2FF0-2FFB] 12字
CJK符号 [3000-303F] 64字
日文假名 [3040-30FF] 189字
CJK注音符号 [3105-312C] 40字
CJK笔画 [31C0-31E3] 36字
全角符号 [FF01-FF60] 96字
CJK兼容 [F900-FAD9] 474字
CJK兼容扩展 [2F800-2FA1D] 542字
PUA(GBK) [E815-E864] 79字
更详细的解释,其实有些是保留的,目的不外乎扩容准备
中日韩字符范围2E80~9FFF
2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。
3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。
4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。
A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。
AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。
F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。
FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角符号等。
对应官方文档
标准CJK文字
http://www.unicode.org/Public/UNIDATA/Unihan.html
全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
http://www.unicode.org/charts/PDF/UFF00.pdf
CJK部首补充:2E80-2EFF
http://www.unicode.org/charts/PDF/U2E80.pdf
CJK标点符号:3000-303F
http://www.unicode.org/charts/PDF/U3000.pdf
CJK笔划:31C0-31EF
http://www.unicode.org/charts/PDF/U31C0.pdf
康熙部首:2F00-2FDF
http://www.unicode.org/charts/PDF/U2F00.pdf
汉字结构描述字符:2FF0-2FFF
http://www.unicode.org/charts/PDF/U2FF0.pdf
注音符号:3100-312F
http://www.unicode.org/charts/PDF/U3100.pdf
注音符号(闽南语、客家语扩展):31A0-31BF
http://www.unicode.org/charts/PDF/U31A0.pdf
日文平假名:3040-309F
http://www.unicode.org/charts/PDF/U3040.pdf
日文片假名:30A0-30FF
http://www.unicode.org/charts/PDF/U30A0.pdf
日文片假名拼音扩展:31F0-31FF
http://www.unicode.org/charts/PDF/U31F0.pdf
韩文拼音:AC00-D7AF
http://www.unicode.org/charts/PDF/UAC00.pdf
韩文字母:1100-11FF
http://www.unicode.org/charts/PDF/U1100.pdf
韩文兼容字母:3130-318F
http://www.unicode.org/charts/PDF/U3130.pdf
太玄经符号:1D300-1D35F
http://www.unicode.org/charts/PDF/U1D300.pdf
易经六十四卦象:4DC0-4DFF
http://www.unicode.org/charts/PDF/U4DC0.pdf
彝文音节:A000-A48F
http://www.unicode.org/charts/PDF/UA000.pdf
彝文部首:A490-A4CF
http://www.unicode.org/charts/PDF/UA490.pdf
盲文符号:2800-28FF
http://www.unicode.org/charts/PDF/U2800.pdf
CJK字母及月份:3200-32FF
http://www.unicode.org/charts/PDF/U3200.pdf
CJK特殊符号(日期合并):3300-33FF
http://www.unicode.org/charts/PDF/U3300.pdf
装饰符号(非CJK专用):2700-27BF
http://www.unicode.org/charts/PDF/U2700.pdf
杂项符号(非CJK专用):2600-26FF
http://www.unicode.org/charts/PDF/U2600.pdf
中文竖排标点:FE10-FE1F
http://www.unicode.org/charts/PDF/UFE10.pdf
CJK兼容符号(竖排变体、下划线、顿号):FE30-FE4F
http://www.unicode.org/charts/PDF/UFE30.pdf