工作中涉及大量文件比对工作,请教大家有通过制作模板等方法对类似合同等模板化的文档内容进行辨别,需要辨别文档中纯复制过来的内容,对于修改或打字的内容能够反显出来。谢谢!
1条回答 默认 最新
- threenewbee 2015-12-04 11:17关注
如果你有原始文件可以对比,那么可以用最短编辑距离算法判断两段文本的相似性。
http://blog.csdn.net/sdjzping/article/details/12843365还有一个办法就是计算两段文本的最长公共子串,这样的子串显然就是复制的。
http://blog.csdn.net/zy799894671/article/details/7761171解决 无用评论 打赏 举报
悬赏问题
- ¥15 关于#python#的问题:求帮写python代码
- ¥20 MATLAB画图图形出现上下震荡的线条
- ¥15 LiBeAs的带隙等于0.997eV,计算阴离子的N和P
- ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
- ¥15 来真人,不要ai!matlab有关常微分方程的问题求解决,
- ¥15 perl MISA分析p3_in脚本出错
- ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
- ¥15 ubuntu虚拟机打包apk错误
- ¥199 rust编程架构设计的方案 有偿
- ¥15 回答4f系统的像差计算