怎么判断一个文本和一个主题的相关度?大家有什么好的算法吗?请大家教教小弟我
如何判断一个文本和一个主题的相关度?大家有什么好的算法吗?请大家教教我
比如我现在的关键字是 “c语言”,还有一个文本。如何判断这个文本是否和c语言相关度呢?
我现在唯一能想到的就是对文本进行分词,然后统计“c语言”在文本中出现的此时,除以总词数,得到相关度的值。
但这个办法不太好,请高手赐教更好的方法呀。
------解决方案--------------------
这个太难了,而且不是计算机技术问题。
比如我现在的关键字是 “c语言”,还有一个文本。如何判断这个文本是否和c语言相关度呢?
我现在唯一能想到的就是对文本进行分词,然后统计“c语言”在文本中出现的此时,除以总词数,得到相关度的值。
但这个办法不太好,请高手赐教更好的方法呀。
------解决方案--------------------
这个太难了,而且不是计算机技术问题。