C++文件汉字统计有关问题
C++文件汉字统计问题
C++如何读取汉字
以每一个汉字为键次数为值
统计每个汉字出现次数
跪求~
谢谢
------解决方案--------------------
读取汉字这个不知道
统计的话用map<string,int>,int型的value记录出现定次数
没读取一个字,使用map.count()来判断是否出现过,已经出现过的map[...]++;没有出现过的map.insert()
------解决方案--------------------
每个汉字都用2个字节表示,这两个字节必须都大于0xa0。
你以两个字节为单位对比就行了。
------解决方案--------------------
将文档转成unicode然后查一下汉字内码的范围。
楼主先google一下汉字编码。你的文本是何编码的gb2312?gbk?utf-8?unicode?
C++如何读取汉字
以每一个汉字为键次数为值
统计每个汉字出现次数
跪求~
谢谢
------解决方案--------------------
读取汉字这个不知道
统计的话用map<string,int>,int型的value记录出现定次数
没读取一个字,使用map.count()来判断是否出现过,已经出现过的map[...]++;没有出现过的map.insert()
------解决方案--------------------
每个汉字都用2个字节表示,这两个字节必须都大于0xa0。
你以两个字节为单位对比就行了。
------解决方案--------------------
将文档转成unicode然后查一下汉字内码的范围。
楼主先google一下汉字编码。你的文本是何编码的gb2312?gbk?utf-8?unicode?