python 向量空间模型相似度计算求大神运行总是通不过

  #用向量空间模型计算两个字符串s和s1之间的相似度

from math import sqrt
from collections import Counter
import re

def vsm_distance(s,s1):

      #将s,s1转化为字典格式（dictionary{词：词频}）
mylist=re.findall(r"\w+",s)
ss=Counter( mylist)
mylist1=re.findall(r"\w+",s1)
ss1=Counter( mylist1)
    #向量空间计算
c = set(ss.keys())&set(ss1.keys())
if not c:
    return 0
x = sum([ss.get(i)*ss1.get(i) for i in c])
sq1 = sqrt(sum([pow(ss.get(i),2) for i in ss.values()]))
sq2 = sqrt(sum([pow(ss1.get(i),2) for i in ss1.values()]))
p = float(x)/(sq1*sq2)
return p

s="KBA is to give a chance to non-popular entities information to be updated as soon as a useful information is published on the internet. The KBA organizershave built up a stream-corpus which is a huge corpus of timestamped web documents that can be processed chronologically. Hence it is possible to simulate a real time system. The documents come from newswires, blogs, forums, review, memetracker….. In addition, a set of target entities, coming from wikipedia or from twitter, has been selected for their ambiguity or unpopularity. And last but not least, more than 60000 documents have been annotated so that systems can train on it. The train period starts on documents published from october 2011 until februray, and the test period starts from februray 2012 to februray 2013."

s1="The KBA track is divided in two tasks:CCR(Cumulative Citation Recommendation) and SSF(Streaming Slot Filling). CCR task is to filter out documents worth citing in a profile of an entity(e.g., wikipedia or freebase article). SSF task is to detect changes on given slots for each of the target entities. This article is focused only on CCR task."

vsm_distance(s,s1)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
oyljerry 2015-07-15 12:54
关注
运行通不过是有什么语法错误还是结果不正确？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python小白求问，selenium安装成功后运行失败，求教大神 python selenium 有问必答
2022-02-08 09:42

回答 3 已采纳将谷歌浏览器驱动直接放在你python 的安装目录即可，如图如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
求Python的孪生支持向量回归代码 python 回归机器学习
2022-06-08 09:34

回答 1 已采纳 TSVR.py import numpy as np from sklearn import preprocessing from sklearn.base import BaseEstimator
python考试题，跪求大神 python 有问必答
2021-06-21 14:19

回答 2 已采纳 def bubbleSort(arr): length = len(arr) for i in range(length - 1): for j in range(0
文本相似度计算python lda_借助LDA主题分析的短文本相似性计算 - 综述帖
2020-12-11 01:28

weixin_39674028的博客目标：针对给定输入文本与文本库，计算得出文本库中与输入文本最相似的文本对于人类，两句话的相似性一般都从语义上进行考虑，大白话说就是”这两句话说的是同一件事儿/同一个意思“。相似的句子可能会有相似的语法...
Python求求大神救救孩子 python windows 有问必答
2021-05-30 11:51

回答 4 已采纳 import random import string from collections import Counter lst = random.choices(string.ascii_lowe
python写的模型，需要以网页的形式展现效果，请教大神指教 bootstrap python 自然语言处理
2021-02-21 22:42

回答 1 已采纳如果想快速开发一个web应用，我给你推荐tornado框架。python 旗下用于 web 开发的框架很多，比如webpy、web2py、bottle、pyramid、zope2、flask、torn
python利用while循环求2到100内的素数，求大神指点 python 有问必答
2021-03-30 20:26

回答 5 已采纳 # 外层循环 i 从2循环到99 i = 2 while(i < 100): # 内层循环 j 从2循环到根号 i j = 2 while(j <= (i/j)): #
word2vec词向量训练及中文文本相似度计算
2016-02-18 00:35

Eastmount的博客本文是讲述如何使用word2vec的基础教程，文章比较基础，希望对你有所帮助！ ...Word2vec是Google公司在...它根据给定的语料库，通过优化后的训练模型快速有效的将一个词语表达成向量形式，其核心架构包括CBOW和Skip-gram。
python3.7 安装requests报错，求大神支招？ python
2019-06-10 11:25

回答 1 已采纳是公司网络限制了，下源码手动安装好了
python用海伦公式求三角形面积运行不了 python
2022-03-26 10:58

回答 1 已采纳多了一句话，可以考虑加句控制结果的小数位。 s = round(s,2)
python numpy 向量的旋转 python
2022-10-08 22:14

回答 2 已采纳第1个是a[0]在前，a[1]在后，第2个正好相反，所以前后不一致了。另外，你这个旋转矩阵感觉有点问题：向量(1,0)旋转-90度，怎么就成(-1,0)了？这不是旋转了180度吗？还有，旋转改用np.
[Python人工智能] 九.gensim词向量Word2Vec安装及《庆余年》中文短文本相似度计算
2019-12-23 21:19

Eastmount的博客本篇文章将分享gensim词向量Word2Vec安装、基础用法，并实现《庆余年》中文短文本相似度计算及多个案例。本专栏主要结合作者之前的博客、AI经验和相关文章及论文介绍，后面随着深入会讲解更多的Python人工智能案例及...
求大神发python小游戏代码 python 有问必答
2021-06-19 16:02

回答 2 已采纳电视节目中的”你来比划我来猜“大家应该都看过，而且很多人也玩过，规则就是一个人看词语比划相应动作和说一些提示，另一个人看不到词语要通过比划的动作猜出来，猜的过程中主持人判断是否符合规则。某一组玩家
python向量运算_Python中的线性代数运算
2021-01-13 18:46

V12119w的博客 Python中的线性代数运算这里，为了熟悉...1.向量创建一个向量我们可以把Python中的向量理解为有限维空间中的点。height_weight_age=[70,170,40]grades=[95,80,75,62]向量运算#### 加法定义——两个向量defvector...
python余弦定理求角_余弦定理计算文章相似度
2021-01-29 08:19

weixin_39673184的博客 Cosine余弦定理计算文章相似度实现思路前些天看了阮一峰大神的文本相似度的实现思路于是就自己搞了一个效果还不错句子A：我喜欢看电视，不喜欢看电影。句子B：我不喜欢看电视，也不喜欢看电影。1首先是分词，这里我...
没有解决我的问题, 去提问

悬赏问题

¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3

python 向量空间模型 相似度计算 求大神 运行总是通不过

3条回答

悬赏问题

python 向量空间模型相似度计算求大神运行总是通不过