如何能够计算两个字符串相似度,比如agccta和acctg这两个字符串,如果可以能得到不相同的位置就很好
4条回答 默认 最新
flying_pig1989 2017-07-31 08:21关注先建立一个词袋,比如:words=['a','b','c',...,'x','y','z','A','B','C',...,'X','Y','Z','0','1','2',....,'8','9'], 用words数组(基底)去分别表示待比较的两个字符串,
即统计每个字符出现的各数,构成一个和words同样大小的一维向量,再计算两个向量的欧几里得距离,距离越小,字符串越相似。解决 无用评论 打赏 举报