工作中涉及大量文件比对工作,请教大家有通过制作模板等方法对类似合同等模板化的文档内容进行辨别,需要辨别文档中纯复制过来的内容,对于修改或打字的内容能够反显出来。谢谢!
1条回答
- threenewbee 2015-12-04 11:17关注
如果你有原始文件可以对比,那么可以用最短编辑距离算法判断两段文本的相似性。
http://blog.csdn.net/sdjzping/article/details/12843365还有一个办法就是计算两段文本的最长公共子串,这样的子串显然就是复制的。
http://blog.csdn.net/zy799894671/article/details/7761171解决 无用评论 打赏 举报
悬赏问题
- ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
- ¥15 让node服务器有自动加载文件的功能
- ¥15 jmeter脚本回放有的是对的有的是错的
- ¥15 r语言蛋白组学相关问题
- ¥15 Python时间序列如何拟合疏系数模型
- ¥15 求学软件的前人们指明方向🥺
- ¥50 如何增强飞上天的树莓派的热点信号强度,以使得笔记本可以在地面实现远程桌面连接
- ¥20 双层网络上信息-疾病传播
- ¥50 paddlepaddle pinn
- ¥20 idea运行测试代码报错问题