100分求汉字算法解决思路
100分求汉字算法
比如 汗 汉 河 三个字都带三点水
遇到此类汉字我需要归成一类,有什么好的办法没
------解决方案--------------------
看编码找规律把(比如这三个字都是0xBA开头的,0xBAB9,0xBABA,0xBAD3)
另:不同编码好像不一样的,你可以参考相关文档
------解决方案--------------------
三个字的编码相近是因为它们的汉语拼音离的比较近,这又能有什么规律呢?呵呵。
比较现实的办法是去找一个支持部首检字的字典软件,看能不能读出它的数据库。
另一种方法是找一个点阵字库,就是先把汉字图形化,然后模式识别吧。
------解决方案--------------------
也许可以根据字模,用不同的模式去匹配一下,不过复杂度太高了,还是先做好映射表比较快
------解决方案--------------------
手工建立映射表,最简单.
------解决方案--------------------
提个思路好了,反正没做过,借鉴五笔
------解决方案--------------------
看看有没有按照笔画编排的汉字库
再看看编码,找规律~~
------解决方案--------------------
虽然不会帮忙顶一下吧
------解决方案--------------------
需要自己造一个按 "偏旁 "与 "笔划多少 "排列的 "字典 ".
------解决方案--------------------
汗 汉 河
要分辨这样的字,首先你的编码基于 "偏旁 "的。或者说, "偏旁 "作为编码的一个独立的单位。而非字作为编码的一个单位。
------解决方案--------------------
unicode:6c3a-706a是从水部(三点水)汉字
资料(字符表)请到unicode.org下载
比如 汗 汉 河 三个字都带三点水
遇到此类汉字我需要归成一类,有什么好的办法没
------解决方案--------------------
看编码找规律把(比如这三个字都是0xBA开头的,0xBAB9,0xBABA,0xBAD3)
另:不同编码好像不一样的,你可以参考相关文档
------解决方案--------------------
三个字的编码相近是因为它们的汉语拼音离的比较近,这又能有什么规律呢?呵呵。
比较现实的办法是去找一个支持部首检字的字典软件,看能不能读出它的数据库。
另一种方法是找一个点阵字库,就是先把汉字图形化,然后模式识别吧。
------解决方案--------------------
也许可以根据字模,用不同的模式去匹配一下,不过复杂度太高了,还是先做好映射表比较快
------解决方案--------------------
手工建立映射表,最简单.
------解决方案--------------------
提个思路好了,反正没做过,借鉴五笔
------解决方案--------------------
看看有没有按照笔画编排的汉字库
再看看编码,找规律~~
------解决方案--------------------
虽然不会帮忙顶一下吧
------解决方案--------------------
需要自己造一个按 "偏旁 "与 "笔划多少 "排列的 "字典 ".
------解决方案--------------------
汗 汉 河
要分辨这样的字,首先你的编码基于 "偏旁 "的。或者说, "偏旁 "作为编码的一个独立的单位。而非字作为编码的一个单位。
------解决方案--------------------
unicode:6c3a-706a是从水部(三点水)汉字
资料(字符表)请到unicode.org下载