python item2vec的实现问题

 from gensim.models import Word2Vec   
import logging  
import sys
reload(sys)
sys.setdefaultencoding('utf8')
from sklearn.model_selection import train_test_split
c = []

def load_sequence(from_path):
    with open(from_path) as fp:
        [c.append(line.strip().split(",")) for line in fp]

def main():
    logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)  
    load_sequence('E:\\wordpython\\1105\\to666.txt') # 加载语料  
    c_train,c_text = train_test_split(c,test_size=0.2)
    model = Word2Vec(c_train, size=20, window=3, min_count=1, workers=1, iter=3, sample=1e-4, negative=20)  # 训练skip-gram模型; 默认window=5  
    test_size = float(len(c_text))
    hit = 0.0
    for current_pattern in c_text:
        if len(current_pattern) < 2:
            test_size -= 1.0
            continue
        # Reduce the current pattern in the test set by removing the last item
        last_item = current_pattern.pop()

        # Keep those items in the reduced current pattern, which are also in the models vocabulary
        items = [it for it in current_pattern if it in model.wv.vocab]
        if len(items) <= 2:
            test_size -= 1.0
            continue

        # Predict the most similar items to items
        prediction = model.most_similar(positive=items,topn=20)

        # Check if the item that we have removed from the test, last_item, is among
        # the predicted ones.
        for predicted_item, score in prediction:
            if predicted_item == last_item:
                hit += 1.0
    print 'Accuracy like measure: {}'.format(hit / test_size)

if __name__ == "__main__":  
    main()

No handlers could be found for logger "gensim.models.doc2vec"是什么回事？也没用doc2vec啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_36873653 2017-11-30 06:07
关注
# Check if the item that we have removed from the test, last_item, is among
# the predicted ones.adaddad

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python spyder 画手绘风出现 invalid syntax 问题 python
2022-07-11 22:07

回答 2 已采纳你注意看 10后面有个点
python图像处理疑问 python 有问必答
2021-09-23 17:36

回答 1 已采纳复制的路径中存在不可见字符，将路径删除后手动输入一下试试，看下可否消除非法字符读取到文件。
Word2Vec报错不可以有索引 python 有问必答
2021-05-31 08:35

回答 2 已采纳应该你传入的参数有问题了，参考一下官方文档：https://www.tensorflow.org/tutorials/text/word2vec 如果对你有帮助，可以点击我这个回答右上方的【采纳】按
item2vec怎么使用gensim？还是直接word2vec
2020-12-21 21:54

推荐算法中的word2vec大牛直接用的该库源码，然后这个玩意目前我无法得到，所以有看到word2vec库，然而这个库不能直接在win下用pip安装，所以我先试试在服务器能不能行？服务器是可以的，依赖环境Cython。不过有个...
深度学习、Python、代码在服务器运行时遇到问题 python 有问必答服务器深度学习
2022-01-22 22:12

回答 2 已采纳 loss_unsup = torch.mean(((tensor_vec-mean_pred)*2)/sigma_est[0]) + 1.0self.lambda_vartorch.log(torch
无法安装mol2vec，显示错误如下 python
2021-08-22 13:04

回答 1 已采纳 pip install git+ GitHub - samoturk/mol2vec: Mol2vec - an unsupervised machine learning approach to
python爬取淘宝商品信息遇到难题。怎么办 python 有问必答
2021-12-15 19:46

回答 2 已采纳你字符串没有用“引号结束 start_url="https://s.taobao.com/search?initiative_id=tbindexz_20170306&ie=utf8&spm=a21b
python item2vec做召回
2021-06-28 14:49

搬砖老头的博客 https://blog.csdn.net/qq_26645205/article/details/81000873 https://github.com/lujiaying/MovieTaster-Open/blob/master/utils/process.py github地址
transformers python word2vec 深度学习
2021-06-25 19:48

回答 1 已采纳肯定不是一回事啊，pytorch的transformer是处理图像的，huggingface的transformers主要是用来做NLP任务的，可以去csdn了解一下两者具体的区别，至于该用哪个取决你
Word有关批注的背景填充问题 microsoft word2vec
2022-11-24 09:09

回答 1 已采纳没有这个功能
获取单一语种词向量wiki.en.vec python 有问必答
2021-08-13 18:00

回答 1 已采纳你可以从这里下载该词向量文件： Page not found · GitHub Pages https://fasttext.cc/docs/en/pre
中文word2vec的python实现
2018-01-27 10:44

笑傲苍穹0的博客第一种方法是去网上下载相关语料，我这里有一个英文语料模型点我下载，它适合于使用word2vec英文训练的语料，约96M，包括常用的英文词汇。而由于中文语料比较少，暂时也是写前期代码测试，就去网上下载了《倚天...
如下该怎么解决tensorflow报错问题呢 keras python tensorflow
2023-04-18 11:09

回答 6 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：这个报错信息意味着在加载 SavedModel 时，无法找到与输入张量匹配的适当函数。每个已保存的函数都只接受特定的输入函数签名，并且当 Saved
item2vec代码
2019-08-22 09:07

烟雨风渡的博客 item2vec = SGNS(len(item), 10) # ~ print(item2vec) optimizer = optim.Adam(item2vec.parameters(), lr=0.001) for epoch in range(1): for i, batch in enumerate(get_batch_sample(100, train_data)):...
word2vec实现域名向量化并计算相似度-python代码
2021-09-01 16:15

小官同学今天按时下班的博客 ip2domain1/domain2/domain3....... ip3domain1/domain2/domain3....... ..... 其中，由于想保证数据的随机性，需要将域名数据随机打乱并生成不同顺序的几组数据。代码： import num...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

python item2vec的实现问题

1条回答 默认 最新

悬赏问题

1条回答默认最新