历时4年的研究,小弟我独自一人在没有任何参考和借鉴的情况上,完全自主研发的搜索引擎〖纳百海知识库〗今天开始公测

历时4年的研究,我独自一人在没有任何参考和借鉴的情况下,完全自主研发的搜索引擎〖纳百海知识库〗今天开始公测
历时4年的研究,我独自一人在没有任何参考和借鉴的情况下,完全自主研发的搜索引擎〖纳百海知识库〗今天开始公测

地址: http://zsk.cangzhuo.com/

大致技术指标:
    一、完全自主研发 
    二、运行平台2G内存 512K带宽 250GSATA硬盘 机器两台 
    三、开发语言纯C语言 
    四、开发周期三天业余时间
    五、研究构思时间四年 
    六、大致流程:信息收集、信息过滤、分布式存储、分布式索引、分词并行检索 

纳百海知识库引擎有以下特点: 
    一、采用实时全文索引方式 
    二、速度快的无与伦比 
    三、量大,可容纳至少1亿贴

虽然诸多不满意的地方,也有N多疏忽之处,不过还是希望各位前辈专家帮我看看,顺便给我一些指点! 

目前还没打算开源,不过我希望有志同道合的加入我的团队,共同发展!

欢迎各位专家、学者、前辈、高人、搜索前辈们踊跃参与测试并批评指正! 
------解决方案--------------------
关注,UP!
------解决方案--------------------
昨晚3点修正了纳百海知识库搜索引擎的最后几个BUG,同时更改了检索算法,新的算法将使搜索结果更精准!

言必行,行必果!发现一个BUG赏黄金千两!

------解决方案--------------------
引用:
昨晚3点修正了纳百海知识库搜索引擎的最后几个BUG,同时更改了检索算法,新的算法将使搜索结果更精准! 

言必行,行必果!发现一个BUG赏黄金千两! 


试了,效果非常好,各种编程知识和日常生活知识都能找到啊,佩服!
------解决方案--------------------
关注,收藏,待有空认真观摩!
------解决方案--------------------
强烈建议开源,大家一起研究嘛^_^
------解决方案--------------------
你的数据都是从百度弄来的把,搜索结果基本差不多,无语。。。
------解决方案--------------------
原来将 # @ +作为标点符号进行了过滤.
经过大家的指正已经进行了改进,
因此现在可以正确搜索 C# C++ 等相关词汇了!

非常感谢大家的指正!谢谢!
------解决方案--------------------
无语。敬佩中。
无知者无畏,无畏者无所谓
------解决方案--------------------
很好很强大,兄弟我帮你编了个顺口溜:
   ^_^新浪爱问百度,百度知道答案在藏拙知识库^_^

不错吧,呵呵,加油哦!
------解决方案--------------------
已经增加了摘要提取和关键词高亮显示功能!

非常感谢大家的指正!谢谢!
------解决方案--------------------
这里有免费的,http://www.dmzg.com/search.html 大家有福了啊。
不含任何插件,可以实现一个简单的垂直搜索引擎,有兴趣研究垂直搜索的朋友,或有意向做垂直搜索或其他行业搜索的朋友,都可以做为参考。该软件包括两部分,服务端(纯C++程序,搜索服务,用于从互联网上搜索),客户端(Java程序,WEB页面)。运行在windows平台,网页搜索结果支持多级缓存,本地硬盘缓存,最近访问的结果内存中缓存,能够实现快速的搜索。不过,想搜索很多页的话,是要收费了的。
------解决方案--------------------
震撼+震惊+佩服

看来要认真努力了!
------解决方案--------------------
UP!