关于word中如何识别纯复制内容的方法

工作中涉及大量文件比对工作,请教大家有通过制作模板等方法对类似合同等模板化的文档内容进行辨别,需要辨别文档中纯复制过来的内容,对于修改或打字的内容能够反显出来。谢谢!

1个回答

如果你有原始文件可以对比,那么可以用最短编辑距离算法判断两段文本的相似性。
http://blog.csdn.net/sdjzping/article/details/12843365

还有一个办法就是计算两段文本的最长公共子串,这样的子串显然就是复制的。
http://blog.csdn.net/zy799894671/article/details/7761171

teddyboy_tj
teddyboy_tj 没有原始文本,而且各种类型的模板成千上万,很难一一对应起来比对。希望仅依靠文件本身就可以直接查看到哪些文字是复制的,哪些是输入或修改的。
接近 4 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
VBA关于WORD中内容复制的问题?
现小弟要实现以下功能,请大虾们指教啊!rn需要实现将WORD文档A里面的前面一部分的内容复制到另一份WORD文档B内容的头部,将A里面的后面的内容复制到B的尾部。为确定A中前后部分的内容,我想了两个解决办法:rn 办法1是在A的中间插入一行,写入“中间”两个字,然后在实现上面拷贝的过程的时候我先找到“中间”这个两个字所在的行row,然后从row-1行开始循环拷贝每一行到B的头部,从row+1行开始循环拷贝每一行到B的尾部,这里就有一个问题,当A中有表格的时候,每当复制到表格尾部那一行的时候就会出错,提示“此属性或方法无效,因为对象涉及表格行尾”,请问这个问题怎么解决啊?rn使用的方法是:rn Dim objWordDraft As Documentrn Set objWordDraft = Documents.Open("h:\\A.doc")rn objWordDraft.Activatern For i = objWordDraft.Paragraphs.Count To 1 Step -1rn MsgBox objWordDraft.Paragraphs(i).Rangern objWordDraft.Paragraphs(i).Range.Copyrn B.粘贴rn Nextrnrn 办法2是在A的中间插入一行,在这一行写入“中间”两个字,然后先找到这两个字的位置position,然后复制开始到position位置的内容到B的头步,复制position到最后的内容到B的尾部,现在问题是我通过什么方法可以知道“中间”这两个字的位置(即position的值)呢。rn使用的方法是:rn Dim objWordDraft As Documentrn Set objWordDraft = Documents.Open("h:\\A.doc")rn objWordDraft.Activatern objWordDraft.Range(0,position).Copyrn B.粘贴rn objWordDraft.Range(position,objWordDraft.Range.End).Copyrnrn请哪位高手指点指点啊,谢谢
如何复制剪切板内容到word
请问VB如何实现获取剪切板的所有内容,不只是文字,希望能图片文字一起,最好加上表格,然后存进指定word文件中?可以的话麻烦给出示例代码~~多谢各位了!
如何识别word格式的内容??急急!!
用JavaScript的控件制作了一个模拟word环境的文本编辑页面,(其实是用html标签来模拟一些简单的word功能)可以提交文本。但是现在把真正word文本里的内容粘进去的时候,总是提交失败!谁能帮我解决一下,或是给我一点思路,谢谢!!rn是不是html语言不识别真正的word格式呀??指点一下!!rn
如何防止Word的内容被复制?
当用Word打开一个.doc文档时,如何防止其内容被拷贝(无论进行什么操作都让光标始终处于第一个位置),但是可以用鼠标拖动滚动条滚动看全部内容。
如何控制Word的打印、另存及内容复制
现在希望通过程序打开Word文件,并且只能浏览,不能复制其中的内容,也不能打印或者另存文件。我所能想到的控件有OLE和WebBrowser,都很难达到这样的要求,不知各位有何高招!rn100分求解!
搜索word中内容的方法
vba中的搜索word字符串的方法怎么写,另外如何用js调用
C#复制Word内容到另一个Word
本篇文章介绍的复制Word内容到另一个Word的操作分为两种情况,一种是复制部分原Word文档内容到另一个Word文档,包括格式、图片、超链接等;另一种是复制文档全部内容(除页眉页脚外)到另一个Word。下面将详细阐述。 使用工具:Free Spire.Doc for .NET (安装后,将Sprie.Doc.dll文件引用到该项目) 一、复制部分内容 C# //新建一个word文档...
c#后台如何获取在word中复制的表格内容
想要在后台获取在word或excel中复制的表格的文本,包括表格的标签、样式、文字内容, 像html table标签那样的内容rnrn用系统剪贴板 Clipboard 类的GetData相关接口只找到了带制表符 \t 的无标签文本
word文档中如何禁止别人复制其中的内容。
有的时候你不想让他人复制你给他传送的word文档中的内容可以使用下述方法。 一、要设置限制复制粘贴,我们需要在审阅这选项里操作。在菜单栏中点开:审阅 二、在右侧的功能区这里,再点:保护;接着,弹出一个小窗口 弹出的窗口如图所示,然后再点击 “限制编辑” 三、然后,在第二项这里打上对勾;并点下拉按钮,弹出的菜单中点选:填写窗体。 四、再在第三项这里,点:是;再弹出一个对话框;输入密码的对话框;...
如何读取word中的内容
我在窗体上设计了个richtextbox1控件,一个命令按钮,并通过这个命令按钮打开一个word读取里面的数据到richtextbox1中,可读出的是乱码?rn代码如下:rnRichTextBox1.FileName = App.Path & "\c++试卷\" & Trim(rest.Fields(1)) & ".doc"rn Open RichTextBox1.FileName For Input As #1rn Input #1, s1rn RichTextBox1.Text = s1rn Close #1rn 请问哪里设计不合理,为什么会出现乱码?rn是不是格式问题?rn
Ps中的内容识别
Ps中的内容识别 (姓名:樊文军 撰写时间:2019年5月28日) 打开ps,导入一张素材图片,快捷键:ctrl+o,在工具栏中找到快速框选工具,多边形套索工具,磁性套索工具等。 点击框选工具,并框选图片中的文字,如图所示。 ,点击左上角的...
如何读取复制的内容?
将一字符串复制以后,用DELPHI如何读取其内容?
如何复制数据库的内容
问题如题,用到的数据库是SQL-SERVER rn比如老的数据库是old,要建一个新的数据库new ,new里边的内容和old里的内容一样,如何在delphi中实现。我现在知道怎么动态建一个新的数据库,并附加到SQL-SERVER上,就是不知道怎么将old数据库中的表复制到new数据库中。
如何复制xml内容?
我的网页使用vbscript或javascript语言,用xmldom取得XML文档后,想在本地保留幅本,也就是把XML文档一字不漏地复制一份,这个要怎么写呢?用什么语言都可以。
如何复制百度文库的内容
每个人都会遇到找的内容就在百度文库里!!! 但又不想花钱买会员下载文档,只想复制的时候。 我是靠以下两种方法来复制的: 1. 用谷歌浏览器的打印功能 例如我们要复制一个百度文库文件。 右键 点击打印,选择另存为pdf. 最后在pdf里面找我们想要的内容。 2.用油猴插件下载脚本复制文库内容。 上一个方法优点在并不用下载什么插件。但并不能打印表格。 若存在表格的文库内容,我们可以利用油猴下载...
如何复制百度文库内容
教你如何复制百度文库,不用分,直接就可以
如何复制文本框的内容?
如:在一个TEXT1.TEXT有一个字符串,如何通过单击一个按钮把它复制(能用CTRL+V实现粘贴)?
关于ewebeditor中WORD图片复制问题求解
前些日子有人推荐我用ewebeditor rnrn可是有个大问题rnrnWORD中的图片不能复制过去。rnrn不能正常显示rnrn有谁知道吗
关于如何从文件内容识别多媒体文件类型?
对一个给定的文件,不从其后缀名(如AVI MPG DAT等)去判断它是何种多媒体文件,因为后缀是很容易被修改的。rn我想请教的是,如何从文件内容本身去判断文件类型,也就是说对诸如AVI MPG 等的多媒体文件,其文件有什么特征?如何读取?rn
如何读取Word中的内容(读取word文件中文字内容)
我想从一个word文档读取出,文字内容,不知道该用什么方法,请各位高人帮忙指点一下,谢谢!!!
关于word中的find方法
我想在一WORD文档中选中一片区域,该区域包含在"┏"和"┛"之间,我想通过查找这两个符号确定我要选择的位置的起点和终点,但是find方法并不返回符合项在文档中的位置,那我怎么办?!?!?
word 中如何去掉复制的文字的底纹?
word 中从别处拷贝的文字经常带有格式,格式可以很容易的清除掉,但是底纹经常不容易被发现。
java poi如何复制word中的table
废话不多说,直接线上代码,具体的操作步骤都有注释 InputStream excelFileInputStream = this.getClass().getClassLoader().getResourceAsStream("templates/order.docx"); XWPFDocument document = new XWPFDocument(excelFileInpu...
如何从Word中无失真的复制图片
你可以使用保存为Web页来得到真实的图片效果,选择“文件→另存为Web页”,将文档保存为一个网页,然后用资源管理器找到网页保存的位置,你会发现一个与Word文件同名的文件夹,其中包含了文档中具有的所有图片,图片效果且没有失真,将需要的图片复制出来即可。...
从word中复制内容包含图片到编辑器中
图片不能显示,我看了一下复制过去的代码。路径是本地的。我想用正则表达式匹配rn文章中的这种标签。rn把图片上传到服务器上,然后替换URL。rn请问正则表达式如何实现呢?rnrnrn还有没有更简单的实现word拷贝到编辑器中得方法呢?rnrnrn谢谢啦
FCKeditor 从word中复制的内容 存不到mysql中
经过记事本格式化数据后,可以成功保存,但没有格式了
关于把Text 中内容复制!
我的程序中Text个数不确定,请问如何把Text 中内容点右键复制和粘贴~~
如何读取剪贴板中的在 Word 中复制的内容,并把它转换成 RTF 格式的内容?
....
word关于复制图片的问题????
我想把一个CHM文件里的一个流程图复制到word里,可是不成功,那个流程图不显示,只有一个空白方框!这是怎么回事???请教高手!
如何识别图片中的文字内容
图片文字识别也就是ocr文字识别,在扫描文档的时候会生成图片文件,在需要使用到图片中的内容时会非常麻烦,如果对照图片重新录入也是需要很多时间的,那么怎样可以快速的图片文字进行识别呢,下面就来教你们怎样直接在线对图片上的文字进行识别并转为word文档。 操作步骤: 一、首先找到在线图片识别工具,找到后点击进入页面。在ocr文字识别中选择“ocr图片识别”,跳转到该项操
关于word网页内容复制的问题?
以前word97复制网页内容,不会将网页内表格等非文字信息也复制进来,可word2000/xp却将它们都复制进来,如何只复制文字内容?
word文档内容复制和定位的问题
我用VB6做这个功能.rn我使用了range.Characters(i).FormattedText属性来从一个现有的rndocument里复制内容到一个新建的document中,最后保存.rnrn我遇到的问题是,这样做的时候如果是字符或图片之类的没什么问题.rn但是如果是表格的话它会报错说 "表格已经损坏,请先保存文档",然后也rn许还会非法操作.rn请问这是怎么回事,我应该怎么做,才能达到我要的功能.rnrn我的代码如下rn Dim wapp As New Word.Applicationrn Dim wdocSource As Word.Documentrn Dim wdocDest As Word.Documentrn Dim rgnSource As Word.Rangern Dim rgnDest As Word.Rangern...rn Set wdocDest = wapp.Documents.Addrnrn Set rgnSource = wdocSource.Rangern Set rgnDest = wdocDest.Rangernrn lCnt = rgnSource.Characters.Countrn For i = 1 To lCnt rn With rgnDest.Characters(i)rn .FormattedText = rgnSource.Characters(i).FormattedTextrn End Withrn DoEventsrn Nextrnrn wdocSource.Close rn wdocDest.SaveAs strDestrn...
ftb1.6.3不能复制Word内容的问题
我用ftb(FreeTextBox 1.6.3)来提交内容,当拷贝word里面的内容到ftb里面进行提交,结果出错,怎样解决呢?是不是更新的版本可以解决呢?rnrn例如,ftp的html代码是rn 测试rnrn提交发生如下错误:rnrnSyntax error (missing operator) in query expression '' 测试''. rnDescription: An unhandled exception occurred during the execution of the current web request. Please review the stack trace for more information about the error and where it originated in the code. rnrnException Details: System.Data.OleDb.OleDbException: Syntax error (missing operator) in query expression '' 测试''.
Android中如何复制内容到剪贴板
在开发中时常会将自己需要的内容复制到剪贴板中,这时候可以给这个控件注册上下文菜单,通过弹出上下文菜单,将文本复制到剪贴板中/** * 复制到剪贴板 * @param context * @param url */ public static void copyToClipboard(Context context, String url){
如何逐行复制richtextbox控件中的内容
各位好:rn 我想做这样一个简单的程序,单击按钮,会复制richtextbox控件中的第一行内容,rn第二次单击铵钮,则复制第二行内容,依次类推.rn 刚学VB.NET ,不知道要怎么写这段代码,请指教!
数据库一行内容复制问题?如何复制?
假设我有一个Biddingmessage表,想复制其中一条Code='100001'的数据只是让Code这个主键编程'100002'怎么做?
如何禁止用户复制 textbox 中的内容?
如何禁止用户复制 textbox 中的内容?rn就是让 ctrl+c无效,右键无效
如何复制注册表中子键的内容?
我想把HKEY_CURRENT_USER/SOFTWARE/MYPROGRAM/1子键下的内容拷到HKEY_CURRENT_USER/SOFTWARE/MYPROGRAM/2中,当然1下面有多少个项是不可预知的(下面没有子键)。rn我试过用RegSaveKey()把1下的内容存到文件中,成功,但没有办法把它转到2下面来。不要跟我说用RegRestoreKey(),它只适用于NT,而在95、98下不管用。RegLoadKey()又不支持存到这样的位置。只有一个RegReplaceKey()用了,也不行,但不知道为啥。rn再试着用RegEnumValue()和RegSetValue()配合使用,也不行,Enum时就出错,返回值为87,查了一下,说是参数有问题。rn代码如下:rn LPTSTR name=(LPTSTR)new BYTE[30]; rn DWORD index=0,nameSize,type,contentSize;rn LPBYTE content=new BYTE[80];rn while((result=::RegEnumValue rn (hKey1,index,name,&nameSize,&type,content,&contentSize))rn !=ERROR_NO_MORE_ITEMS)rn rn ::RegSetValueExrn (hKey2,name,0,type,content,contentSize);rn index++;rn rnrn哪位有类似的例程,帮帮我。
如何实现TstringList中的内容复制???
各位同行:rn有两个TstringList:rnplist:=pointList;rn当我删除plist中的内容时,pointList中的内容也一起被删除!rn怎么解决这个问题,实现TstringList中的内容复制???rn小弟先谢谢了!!!
如何复制MenuItem的内容,急!!!!关注中~~
就是实现两个Form的MainMenu的动态对应。发现MenuItem只能在一个菜单里显示!?rn千万帮忙啊CSND的高手们。 rnTMenuItem* MainMenu1->Items;rnwhile(pItem->Count > 0)rnrn TMenuItem* pChildItem = pItem->Items[0];rn pItem->Delete(0);rn PopupMenu1->Items->Add(pChildItem);rnrn这样就只能一次的过来,下次要从新去load的时候就没有东西读了
相关热词 c#入门推荐书 c# 解码海康数据流 c# xml的遍历循环 c# 取 查看源码没有的 c#解决高并发 委托 c#日期转化为字符串 c# 显示问号 c# 字典对象池 c#5.0 安装程序 c# 分页算法