读取一个TXT,怎么判断是否宽字节呢
读取一个TXT,如何判断是否宽字节呢?
读取一个TXT,如何判断是否宽字节呢?
使用READFILE读取的
------解决方案--------------------
建议先看看ansi,gb2312,gbk,gb18030,unicode,utf-8,unicode big endian编码的区别
简单的说就是:
开头两字节是FF FE,则为Unicode;若为FE FF,则为uncode big endian;若前三字节为EF BB BF,则为UTF-8。
------解决方案--------------------
给定一个串,理论上无法判断它所属的字符集,毕竟你可以按照任何字符集的规定来理解这个串
windows提供了一个函数IsTextUnicode,可以从统计学的规律来告知这个串是否是unicode,样本集越大结果越准确,但是始终无法保证100%正确
------解决方案--------------------
总的来说很难. 计算机内部数字表示都是一些二进制数据.
所以当你遇到一个字节.
0xAB 你怎么判断它是什么编码类型呢? ASCII ? UTF-8 ? , UTF-16 ?
读取一个TXT,如何判断是否宽字节呢?
使用READFILE读取的
------解决方案--------------------
建议先看看ansi,gb2312,gbk,gb18030,unicode,utf-8,unicode big endian编码的区别
简单的说就是:
开头两字节是FF FE,则为Unicode;若为FE FF,则为uncode big endian;若前三字节为EF BB BF,则为UTF-8。
------解决方案--------------------
给定一个串,理论上无法判断它所属的字符集,毕竟你可以按照任何字符集的规定来理解这个串
windows提供了一个函数IsTextUnicode,可以从统计学的规律来告知这个串是否是unicode,样本集越大结果越准确,但是始终无法保证100%正确
------解决方案--------------------
总的来说很难. 计算机内部数字表示都是一些二进制数据.
所以当你遇到一个字节.
0xAB 你怎么判断它是什么编码类型呢? ASCII ? UTF-8 ? , UTF-16 ?