文本比较算法,给点建议解决思路
文本比较算法,给点建议
将两个文件按Bit位进行比较,得出两个文件的差异!!!
给点建议,谢谢!!!
------解决方案--------------------
找到xor差值最小的那个情况?
------解决方案--------------------
首先你要定义差异 你不能说多了一个字符“我认为”差异就很小。
------解决方案--------------------
有的时候多一个字符,一样完全变了。
对于计算机也一样,我觉的楼主这个应该先定义patten再进行比较。
------解决方案--------------------
这个叫“最短编辑距离”,但实际应用里面,会使用分行的方式和局部贪心的做法降低时空复杂度
------解决方案--------------------
你可以看看HexWorkshop的“文件重新同步比较”功能,有时候很准,有时候就很不准。
估计是没有一个好的算法能实现这个功能。
------解决方案--------------------
可以先分8次匹配,每次用字节模式匹配处理需要时,额外检测下,两头两个字节,就可以了
------解决方案--------------------
把短的位流移位7次,不就得到8个字节流的字符串了么
然后8个字符串分别用KMP去匹配就好了
------解决方案--------------------
看LZ的需求,基本上是要在B中查找与A的最大匹配位置吧
将两个文件按Bit位进行比较,得出两个文件的差异!!!
给点建议,谢谢!!!
------解决方案--------------------
找到xor差值最小的那个情况?
------解决方案--------------------
首先你要定义差异 你不能说多了一个字符“我认为”差异就很小。
------解决方案--------------------
首先你要定义差异 你不能说多了一个字符“我认为”差异就很小。
有的时候多一个字符,一样完全变了。
对于计算机也一样,我觉的楼主这个应该先定义patten再进行比较。
------解决方案--------------------
这个叫“最短编辑距离”,但实际应用里面,会使用分行的方式和局部贪心的做法降低时空复杂度
------解决方案--------------------
你可以看看HexWorkshop的“文件重新同步比较”功能,有时候很准,有时候就很不准。
估计是没有一个好的算法能实现这个功能。
------解决方案--------------------
可以先分8次匹配,每次用字节模式匹配处理需要时,额外检测下,两头两个字节,就可以了
------解决方案--------------------
可以先分8次匹配,每次用字节模式匹配处理需要时,额外检测下,两头两个字节,就可以了
没太明白,其实我的数据是位流,
不是字节流,
所以单纯的比较字节的话是不行的
把短的位流移位7次,不就得到8个字节流的字符串了么
然后8个字符串分别用KMP去匹配就好了
------解决方案--------------------
看LZ的需求,基本上是要在B中查找与A的最大匹配位置吧