请问算法高手:检测不同文件中的相同内容

请教算法高手:检测不同文件中的相同内容
有一批文件,其中都包含一段相同的内容,不知道此内容的长度。如何能够检测出这段内容呢?

------解决方案--------------------
两两求交集,在求交集的交集
------解决方案--------------------
KMP??
------解决方案--------------------
咋感觉怪怪的。。
不知道该段内容的长度,也就是该段内容没有确定,也就是找不确定的东西,能找到么?。。。
------解决方案--------------------
总得有点规律吧。

比如:一个字节算不算一段内容?
------解决方案--------------------
也许可以试试DP(动态规划)看看。
------解决方案--------------------
就是LCS(最长公共子串)的问题,搂主可以查一下这方面的资料,算法和原码网上都有很多,用楼上提到的DP处理比较简单一点,具体要看两个文件的大小来算复杂度,最后选择合适的算法。
------解决方案--------------------
他这个问题似乎可以抽象为满足某一条件的最长公共子串
------解决方案--------------------
搜索:
余弦算法
------解决方案--------------------
后缀数组呢

------解决方案--------------------
lcs不适合求连续的公共子串问题吧