zhangzxpan 2023-01-03 10:10 采纳率: 76.5%
浏览 41
已结题

有什么能寻找标注出两篇中相似段落的开源项目吗?

目前需要开发出一个功能,对比查找并标注出两篇文章中类似的段落或者词句,有什么开源项目有这个功能吗?
其实有点像论文查重的功能,有论文查重的比较通用的开源项目推荐吗?

  • 写回答

6条回答 默认 最新

  • |__WhoAmI__| 2023-01-03 14:00
    关注

    有几个 Python 库可以帮助实现这个功能:

    1、Python 的 difflib 库可以用来比较两篇文章的差异,并生成一个差异报告。

    2、Gensim 是一个用于自然语言处理的库,其中包含了一个 Doc2Vec 模型,可以用来计算两篇文章的相似度。

    3、Python 的 textdistance 库提供了许多文本相似度算法,包括 Jaccard 相似度、Levenshtein 距离等。

    如果想要找一个开源的论文查重工具,可以考虑使用 MOSS (Measure of Software Similarity),它是由 Stanford 大学开发的一个用于检测程序代码抄袭的工具。MOSS 可以比较两个程序代码之间的相似度,并生成一份报告,显示出两个程序中相似的部分。MOSS 可以支持多种编程语言,包括 C、C++、Java 等。
    仅供参考,望采纳,谢谢。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(5条)

报告相同问题?

问题事件

  • 系统已结题 1月17日
  • 已采纳回答 1月9日
  • 创建了问题 1月3日

悬赏问题

  • ¥20 CST怎么把天线放在座椅环境中并仿真
  • ¥15 任务A:大数据平台搭建(容器环境)怎么做呢?
  • ¥15 r语言神经网络自变量重要性分析
  • ¥15 基于双目测规则物体尺寸
  • ¥15 wegame打不开英雄联盟
  • ¥15 公司的电脑,win10系统自带远程协助,访问家里个人电脑,提示出现内部错误,各种常规的设置都已经尝试,感觉公司对此功能进行了限制(我们是集团公司)
  • ¥15 救!ENVI5.6深度学习初始化模型报错怎么办?
  • ¥30 eclipse开启服务后,网页无法打开
  • ¥30 雷达辐射源信号参考模型
  • ¥15 html+css+js如何实现这样子的效果?