垃圾邮件处理,贝叶斯算法中hash表是怎样建立的?解决方法
垃圾邮件处理,贝叶斯算法中hash表是怎样建立的?
如题,我用map存储的,然后运行会很慢,如有做过的请给点建议吧︿_︿。
hash表应该会加快速度,但是不知怎样影射。
再就是新邮件中token串的提取,是不是要用到字典什么的,定义token串,不是全部提取,有没有巧妙的提取方法?不然全部提取会使程序运行起来极其的慢。
------解决方案--------------------
帮顶,不会
------解决方案--------------------
gcc中有hash_multimap的实现,在include文件夹
The C++ Programming Language中也有一个简单的hash_map实现,自己找找看吧
------解决方案--------------------
#include "xxx.h " // 在当前目录里找
#include <xxx.h> // 在include_path中找
你都是 #include "xxx.h " 的吗? 原来怎么会对的啊? 怪!
如题,我用map存储的,然后运行会很慢,如有做过的请给点建议吧︿_︿。
hash表应该会加快速度,但是不知怎样影射。
再就是新邮件中token串的提取,是不是要用到字典什么的,定义token串,不是全部提取,有没有巧妙的提取方法?不然全部提取会使程序运行起来极其的慢。
------解决方案--------------------
帮顶,不会
------解决方案--------------------
gcc中有hash_multimap的实现,在include文件夹
The C++ Programming Language中也有一个简单的hash_map实现,自己找找看吧
------解决方案--------------------
#include "xxx.h " // 在当前目录里找
#include <xxx.h> // 在include_path中找
你都是 #include "xxx.h " 的吗? 原来怎么会对的啊? 怪!