JavaEye新版最惊人的bug
JavaEye新版最严重的bug!
© 2003-2007 iteye.com. All rights reserved. 上海炯耐计算机软件有限公司 [ 沪ICP备05023328号 ]
现在都2008了,网站没有保留自己的权力哦~~~
是不是要加偶50分来着?
一直不明白相关文章是怎么列出来的, 很多看起来也没什么相关性
一直不明白相关文章是怎么列出来的, 很多看起来也没什么相关性
确实没有什么相关性, JE这个search的relevance还不行啊~!
你还没有看过那篇科普,帖子中的关键词密度算法并不是越高越好,因为它虽然是TF的因子,同时也是IDF公式的指数运算的分母,过高的关键词密度就会导致这个关键词分数指数级下降。
BTW:真要较真,其实Google也很容易fool,否则哪来那么多SEO公司和点击欺诈官司呢?
引用
© 2003-2007 iteye.com. All rights reserved. 上海炯耐计算机软件有限公司 [ 沪ICP备05023328号 ]
现在都2008了,网站没有保留自己的权力哦~~~
是不是要加偶50分来着?
1 楼
jvincent
2008-01-02
现在已经是2008了...
2 楼
maxiaoxia
2008-01-02
:idea: 又作测试得潜质~
3 楼
zhyun29
2008-01-02
建议把这个年份作为一个变量,从系统时间自动获取
4 楼
dennis_zane
2008-01-02
每个帖子的相关文章小栏目的底色感觉太艳丽了
5 楼
imjl
2008-01-02
好8哦。。。哈哈哈
6 楼
Feiing
2008-01-02
dennis_zane 写道
每个帖子的相关文章小栏目的底色感觉太艳丽了
一直不明白相关文章是怎么列出来的, 很多看起来也没什么相关性
7 楼
daquan198163
2008-01-02
©2007 Google - ICP证合字B2-20070004号
8 楼
longleg
2008-01-02
改的真快
© 2003-2008 iteye.com. All rights reserved. 上海炯耐计算机软件有限公司 [ 沪ICP备05023328号 ]
© 2003-2008 iteye.com. All rights reserved. 上海炯耐计算机软件有限公司 [ 沪ICP备05023328号 ]
9 楼
lordhong
2008-01-03
Feiing 写道
dennis_zane 写道
每个帖子的相关文章小栏目的底色感觉太艳丽了
一直不明白相关文章是怎么列出来的, 很多看起来也没什么相关性
确实没有什么相关性, JE这个search的relevance还不行啊~!
10 楼
robbin
2008-01-03
相关文章的算法叫做:TF/IDF(term frequency/inverse document frequency) ,关于这个算法,可以看看这篇科普:
http://googlechinablog.com/2006/06/blog-post_27.html
之所以你觉得相关性不准确,原因在于:
1、你发的这篇主题贴内容太短,TF/IDF算法难以准确提取主题词汇,不知道你的中心思想在哪里,写的越长的文章,写的越好的文章,运算准确度越高
2、技术文章的主题词汇高度集中,而且整个论坛帖子的样本量很大,所以技术贴的相关文章就准确的多,而你发的灌水贴,主题词汇太分散,样本量也不够,不准确是很正常的。
http://googlechinablog.com/2006/06/blog-post_27.html
之所以你觉得相关性不准确,原因在于:
1、你发的这篇主题贴内容太短,TF/IDF算法难以准确提取主题词汇,不知道你的中心思想在哪里,写的越长的文章,写的越好的文章,运算准确度越高
2、技术文章的主题词汇高度集中,而且整个论坛帖子的样本量很大,所以技术贴的相关文章就准确的多,而你发的灌水贴,主题词汇太分散,样本量也不够,不准确是很正常的。
11 楼
lordhong
2008-01-03
robbin大侠登场鸟~~~。。。那如果我写了很多技术术语的keywords在里面,比如一直重复j2ee,spring,hibernate,j2ee,spring,hibernate,j2ee,spring,hibernate,j2ee,spring,hibernate,那是不是能fool这个算法?
12 楼
lordhong
2008-01-03
忘记说了,新年快乐啊,新版很不错!
13 楼
robbin
2008-01-03
lordhong 写道
robbin大侠登场鸟~~~。。。那如果我写了很多技术术语的keywords在里面,比如一直重复j2ee,spring,hibernate,j2ee,spring,hibernate,j2ee,spring,hibernate,j2ee,spring,hibernate,那是不是能fool这个算法?
你还没有看过那篇科普,帖子中的关键词密度算法并不是越高越好,因为它虽然是TF的因子,同时也是IDF公式的指数运算的分母,过高的关键词密度就会导致这个关键词分数指数级下降。
BTW:真要较真,其实Google也很容易fool,否则哪来那么多SEO公司和点击欺诈官司呢?
14 楼
lordhong
2008-01-03
多谢robbin指教!