怎么快速计算两个字符串相似度

如何能够计算两个字符串相似度,比如agccta和acctg这两个字符串,如果可以能得到不相同的位置就很好

4个回答

先建立一个词袋,比如:words=['a','b','c',...,'x','y','z','A','B','C',...,'X','Y','Z','0','1','2',....,'8','9'], 用words数组(基底)去分别表示待比较的两个字符串,
即统计每个字符出现的各数,构成一个和words同样大小的一维向量,再计算两个向量的欧几里得距离,距离越小,字符串越相似。

这些效率不高啊,磁带能记录位置?

分别遍历两个字符,定义一个计数器,然后分别对别,相同计数器加一,最后计数器的值除以字符中字母总数

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
编辑距离(LD)计算两个字符串相似度
【定义】设A和B是两个字符串。将字符串A转换为字符串B所用的最少字符操作数称为字符串A到字符串B的编辑距离。( 这里所说的字符操作包括:删除一个字符,插入一个字符,修改一个字符) 求编辑距离和两个字符串相似度 算法的原理就不做赘述了,记录一下从拿到两个字符串到计算出两个字符串相似度的计算过程。 首先,会有两个字符串这里举例 A串为:GAATTCAGTTA B串为:GGATCGA
计算字符串相似度
  编程之美3.3   看完题后,毫无头绪   书上的解题思路很好,首先两个字符串的距离肯定是个可知数,必须小于两字符串之和。   可以通过删除操作将两个串都变成空串。   书上所示的递归方法,代码敲出来了,有点点不同   view plain copy to clipboard print ?   #include   #include   #include ...
求用java计算两个字符串相似度的方法
各位大虾,问题是这样的。已知一个字符串,现在有一个字符串数组。用这个字符串数组去数组中找到一个与其相似度最高的字符串(此算法要求高精确度,复杂度和时间可暂不考虑),一定要求高精确度。不知道谁有好的实现算法,求帮帮小弟。。。
mysql 计算字符串相似度
输入2个中文字符串,计算2个字符串的相似度,用于相似度排序。
Java 计算字符串相似度——Levenshtein
介绍:莱茵斯坦距离 计算相似度 先取两个字符串长度的最大值maxLen,用需要操作数除maxLen,得到相似度。           例如abc和abe 一个操作,长度为3,所以相似度为1/2=0.666 public class CharacterStringAcquaintanceDegree { /** * 莱茵斯坦距离——相似度计算 * * @param 参数1 ...
计算字符串相似度的一些方法
产品出了一个奇怪的需求,想通过字符串相似度取匹配城市= =(当然,最后证实通过字符串相似度取判断两个字符串是不是一个城市是不对的!!!) 这里就记录一下我计算字符串(英文字符串)相似度的方法吧~ 参考文档: python_levenshtein 的安装和使用 相似度算法之余弦相似度 Levenshtein Levenshtein.hamming(str1, str2) 计算汉明距离。要求s...
计算字符串相似度Levenshtein的优化
优化前代码的代码来自于——路在脚下:计算字符串相似度算法——Levenshtein http://wdhdmx.iteye.com/blog/1343856 原创博文,也是博主的处女作,先谢过大家愿意花时间来看我唠叨了~~~~~~~~~~~~~~~~~~~~华丽分割线~~~~~~~~~~~~~~~~~~~~~~~~~非常建议学习Levenshtein之前先看看上面这边文章,通俗易懂。 以下是优
python-levenshtein —— 字符串相似度的计算
1. 可数名词(count/countable noun)语言学上,一个可数名词可以被一个数值修饰,无论单数(singular)还是复数(plural)形式,同时也可出现一些定量的限定词(determiners ),诸如 each,every,several,等。不可数名词(mass noun)则不具备这些性质;中文(普通话)则将所有的名词视为不可数名词,且其常常还需要量词的修饰:
java 计算字符串相似度
java 计算字符串相似度
SQL中计算字符串相似度
现在在一个表 A 中有将近20万条记录,表的结构是: 英文原字符,英文原字符串长度,中文意译字符。现在有一个英文的词或者句子,需要和表A中的“英文原字符”列比较后,得出相似度大于90%的记录。rnrn这样的SQL函数怎么写?我写了好长也没有什么好的办法。rn若能有朋友将函数写的比较完善,我将额外奉送400分。谢谢。
计算字符串相似度的矩阵算法
计算字符串相似度的矩阵算法 李彬 (武汉理工大学计算机学院  武汉  430070) 摘  要:用两个字符串滑动比较时匹配的字符数和两字符串滑动比较的重叠率定义了相似度的衡量指标,在确定一个字符串较另一个字符串较少的情况下,设计了一种算法,实现了在字符串匹配矩阵中确定插入空格的位置使相似度指标达到最大值,可以用于信息的模糊检索。 关键词:匹配率;相似度;匹配矩阵;信息量 中图法分类...
编程之美 - 计算字符串相似度
问题描述: 有两个不同的字符串,通过使用一套操作方法可以把两个字符串变成一样的。 例如: 1)  "a" 和 "b"  ==>  把a变成b,或把b变成a  变化了一次 2)  "abc" 和 "ade"  ==>  把bc变成de,或把de变成bc  变化了两次 3)  "abcd" 和 "abcde"  ==>  删除e  变化了一次 每操作一次,两个字符串的距离就
Matlab计算字符串相似度
运行环境:Matlab单纯的计算字符串的相似度,并没有计算词性,如TF-IDF之类的;代码如下:%计算字符串相似度 %一个source字符串通过插入、删除、替换而变成target字符串的操作次数越少,则两个字符串越相近。 function strsim = mystrsim(target,source) %X为字符串矩阵 len1=length(source); len2=length(targ
两个字符串相似度匹配
比较两串字符里面有百分之多少相似,不过好像不是很准确。
lucene有没有计算字符串相似度的函数
rn我想求两个字符串的相似度。rnrn想偷个懒,找个现成的。lucene有没有这样的函数拿来用一下。嘿嘿
动态规划-计算字符串相似度 Levenshtein Distance
编程之美这本书里说过: 许多程序会大量使用字符串。对于不同的字符串,我们希望能够有办法判断其相似程序。我们定义一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为: 1.修改一个字符(如把“a”替换为“b”);   2.增加一个字符(如把“abdd”变为“aebdd”); 3.删除一个字符(如把“travelling”变为“traveling”); 比如,对于“abcdefg”和...
PHP中计算字符串相似度的函数
similar_text — 计算两个字符串的相似度 int similar_text ( string $first , string $second [, float &$percent ] ) $first 必需。规定要比较的第一个字符串。 $second 必需。规定要比较的第二个字符串。 $percent 可选。规定供存储百分比相似度的变量名。 两个字符串的相似程度计算依据 ...
52 计算字符串的距离/79计算字符串相似度
题目描述 Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。 Ex: 字符串A:abcdefg 字符串B: abcdef 通过增加或是删掉字符”g”的方式达到...
【excel VBA】excel 计算字符串相似度
Private Function min(one As Integer, two As Integer, three As Integer) min = one If (two < min) Then min = two End If If (three < min) Then min = three End I
有没有比较两个字符串相似度的函数?
如题rnrn在sql中两个中文字符串怎么判断相似百分比 rn rn 比如:'我是中国人' 和 '我是外国人' rn 他们的相似百分比应该是80% rn 这个算法应该怎么做呢?
字符串相似度
求教怎么样计算两个字符串的相似度; 比如说“卫星图曝光中国正在海南建航母母港 国防部回应”和“中国航母建造情况”。想做一个类似小黄鸡的比较简单的智能系统
字符串相似度算法 字符串相似度算法 字符串相似度算法
字符串相似度算法 字符串相似度算法 字符串相似度算法 字符串相似度算法 相似度 字符串
DELPHI 计算两个字符串相似度 LCS算法(附源代码)
比较两个字符串的相似度,利用LCS算法计算出两个字符串的最长公序列,根据最长公序列得出相似度,例如: 字符串1:1234 字符串2:51234,则他们的相似度为:4*2/(4+5)。
怎么计算两个时间差
怎么计算两个时间差 java 后台
怎么计算两个字串?
RT```rn比如textbox1里有个值是XSC0001rntextbox2里填的是要去掉的值 比如为XSCrn想得出0001rnVB有办法去掉这个值么?
LEVENSHTEIN DISTANCE(LD)-计算两字符串相似度算法
  LEVENSHTEIN DISTANCE(LD)-计算两字符串相似度算法 两字符串相似度计算方法有好多,现对基于编距的算法的相似度计算自己总结下。   简单介绍下Levenshtein Distance(LD):LD 可能衡量两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值。 举例: 如果str1=&quot;test&quot;,str2=&quot;tes...
计算字符串相似度的函数,为什么运行十分缓慢?!!
create function f_StrCompare(@str1 varchar(8000),@str2 varchar(8000)) rn returns varchar(10) rn as rn begin rn declare @i int,@j int,@k int,@ret varchar(10) rn select @i = max(strlen),@j=min(strlen),@k=0 rn from (select strlen=len(@str1) union select strlen=len(@str2)) t rn rn if(@j=0) rn return 0 rn rn while @j>0rn beginrn while @i>0rn begin rn if(len(@str1)-len(@str2))>0 rn if(substring(@str1,@j,1)=substring(@str2,@i,1)) rn begin rn set @k=@k+1 rn set @i=@i-1rn end rn elsern if(substring(@str1,@i,1)=substring(@str2,@j,1)) rn begin rn set @k=@k+1 rn set @i=@i-1rn end rn end rn set @j=@j-1rn endrn rn set @ret = @K rn return @ret rn end rn go rn rn declare @str1 varchar(8000),@str2 varchar(8000) rn set @str1='我是国人' rn set @str2='我是外国人' rn select dbo.f_StrCompare(@str1,@str2) rn go rn rn drop function f_StrComparernrn上面的函数代码以及测试的例子,运行测试例子时,10多分钟都没出来结果。rn我想运行出来的结果是 rn------rn4rnrn函数代码有什么问题吗?再再一次的请各位达人帮忙!!rn
LeetCode之计算字符串相似度或编辑距离EditDistance
问题描述:/** * Given two words word1 and word2, find the minimum number of steps required to * convert word1 to word2. (each operation is counted as 1 step.) * * You have the following 3 operations pe
计算两个字符串的编辑距离 -- 快速算法
计算两个字符串的编辑距离 -- 快速算法
快速计算两个List的不同元素
public class ListUtil { /** * 利用map计算两个list的不同元素 * 时间复杂度2(n+m) * 如果long List在前,map#get次数较多,影响性能 * * @param longList 长度大的列表 * @param shortList 长度小的列表 * @param T>
字符串相似度算法
字符串相似度算法 编辑距离算法解析
比较字符串相似度
java根据不同的比较条件对比两个或两个以上的字符之间的相似度
字符串相似度比较
这个demo运行起来要注意,字符串数量不能太大,不然会发生内存泄漏
最小编辑距离(字符串相似度)
编辑距离问题:又称Levenshtein距离,由俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。要用最少字符操作将字符串A转换为字符串B。例如将kitten一字转成sitting:(1)sitten(k--->s);(2)sittin(e
字符串相似度问题
一个字符串可以通过增加一个字符,删除一个字符,替换一个字符得到另外一个字符串,假设,我们把从字符串A转换成字符串B,前面3种操作所执行的最少次数称为AB直接的度,请写出程序求两字符串直接的度rn如 abc adc 度为 1rn ababababa babababab 度为 2rn abcd acdb 度为2rnrn我用动态规划写的,好像有问题,各位帮忙看下rnrn[code=C/C++]rnint c[a.len+1][b.len+1];rnrnc[i][j]=0;(0<=i<=a.len,0<=j<=b.len)//初始化,全部为0rnrnfor(int i=1;i<=a.len;++i)rnrn for(int j=1;j<=b.len;++j)rn rn if(a[i-1]==b[j-1]) c[i][j]=c[i-1][j-1];rn elsern rn c[i][j]=min(c[i-1][j],c[i][j-1],c[i-1][j-1])+1;rn rn rnrnrn[/code]
两个字符串时间差怎么计算?
js 道得到得到两个时间字符串型如:d1="2008-01-09 10:12" d2="2008-01-10 13:24"rn怎么计算着两个的时间差(分钟)
怎么计算两个时间的间隔?
当我两次用GetLocalTime获得了当前时间后,要怎样才能算出两个时间的间隔?rn我这样做的目的是:既要知道当前的时间,又要计算两个时间的间隔。如果有替换方法也可以。
两个字符串日期怎么计算?
//下面是字符串日期-字符串日期 日期-日期 字符串-日期 日期-字符串的4个函数  只需要把这个类封装成一个工具,然后就可以使用了    //注意:只能计算像2017-4-5 减去 2016-7-23 =xx天这样的, 这4个函数不精确到小时  package tool; import java.util.Date; /**  * 后面的减去前面的  * @author HP
怎么计算两个时间的差值?
是日期类型的,得到的结果是天数。
SQL怎么计算两个时间差?
数据库类型为GETDATE()rn计算数据库内DTTIME的时间于当前时间想减,得到相差多少秒,rn如果 .... .... 23:02:43rn和 .... .... 23:03:05rn想减,应该得到 22,为INT值,怎么做啊?
相关热词 c# stream 复制 android c# c#监测窗口句柄 c# md5 引用 c# 判断tabtip 自己写个浏览器程序c# c# 字符串变成整数数组 c#语言编程写出一个方法 c# 转盘抽奖 c#选中treeview