word2vec以及paragraph vector的原理细节？

大家好，我是刚开始学习NLP这方面的知识，在学CBOW、SKIP-GRAM以及paragraph vector过程中遇到几个不理解的地方，烦请高手指点~~
1、CBOW中随机初始化的word vec有没有归一化？也就是向量的每个维度的值的范围是？若有归一化（每个值都是-1到1），那么输入层到输出层的求和操作之后，是否还需要进行归一化？
2、大家知道，Mikolov提出的paragraph vec方法就是在CBOW的输入层增加了一个paragraph vec，那请问整个算法过程是：①先用原先CBOW的方法根据整个语料库训练出词典中每个词的向量以及网络中的参数；然后固定所有词向量以及网络参数，选定某个paragraph，在输入层加入随机初始化的paragraph vec，在选定的paragraph中随机选取一个context，将context中的词的vec连同初始化得到的para vec一起输入网络，然后梯度下降来更新para vec直到收敛，这样得到了相应para的vec，继续对下一个para处理。
还是②训练时对于每个para随机初始化一个vec，训练word vec的同时也对para vec进行更新。等整个语料库训练完后，就得到了词典中所有词的vec以及每个para的vec？
3、skip-gram和CBOW的区别。CBOW是用context预测下一个词，比如“this is a paper”，用this is a 预测下一个词会是什么。skip-gram是用一个词来预测它的context，是否可以理解为：把“this is a”当成一个词来预测context（也就是下一个词paper）？skip-gram相比于CBOW有什么优或劣处？实际应用中哪个更常用呢？

在此谢谢您的指导~

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-11-17 06:51
关注
http://blog.csdn.net/itplus/article/details/37969519

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

错误：'Word2Vec' object is not subscriptable，应该怎么修改呢 python 有问必答
2021-05-09 15:33

回答 5 已采纳如是标示的那行出错的话，应该是model调用错误，使用了字符作为下标引用了，如代码中引用方法，model应该是一个字典型的数据才行。检查一下model定义及类型。
Word2Vec报错不可以有索引 python 有问必答
2021-05-31 08:35

回答 2 已采纳应该你传入的参数有问题了，参考一下官方文档：https://www.tensorflow.org/tutorials/text/word2vec 如果对你有帮助，可以点击我这个回答右上方的【采纳】按
Word2Vec中new LineSentenceIterator()默认File类型，multipartfile咋整？ java spring
2019-07-07 22:05

回答 2 已采纳后面看到楼上的简书链接，之前有看到过，本觉得用不上，后来再看一遍，到提示了我，可以换个能够接受String类型的方法，刚好有个Collection类，虽然可以保留Multipartfile，但是目标文
Doc2Vec、Paragraph Vector介绍
2022-03-16 18:09

AI强仔的博客 doc2vec、Paragraph Vector克服了word vector的两个缺点，一是使“powerful”相比“Paris”更靠近“strong”，二是考虑了单词顺序，至少在小的上下文中。
请问vector<int> vec大小的问题？ c++
2019-08-04 16:41

回答 3 已采纳你说的没错。 -1 对应 0xFFFFFFFF，无符号就是 2的32次方-1，也就是4294967295
word表格插入一寸照，无法填充满表格，下面有个回车符删不掉，如何解决？ word2vec
2022-04-13 12:44

回答 1 已采纳右键点图片，环绕文字改为浮于文字上方，然后改变相片大小，占满表格就行了。如有帮助，请采纳！
Word有关批注的背景填充问题 microsoft word2vec
2022-11-24 09:09

回答 1 已采纳没有这个功能
【NLP】Word2Vec 介绍
2023-03-06 18:31

拟禾的博客 Word Embedding（语言是有能量的）
关于vector<string> vec变量使用vec[i].pushback(s)的疑问 c++
2022-03-29 19:56

回答 1 已采纳 vector vec[maxn]意思是定义vector数组，vec[i]拿到的是一个vector，所以有push_back方法，因为vector是个数组容器，所以vec[i][j]表示的是取第i+1个
手机在线评论的用户需求挖掘怎么做？ python word2vec 有问必答聚类
2021-11-30 17:22

回答 2 已采纳这个要根据你的数据提供格式去处理，一般都是pandas，numpy这些模块处理数据
Word批量给图片添加边框，宏当中的边框样式、颜色、宽度代码是多少 javascript word2vec 有问必答
2021-08-04 11:23

回答 1 已采纳你可以录制宏，然后直接看源码。
fasttext 与 word2vec、doc2vec 的区别
2020-04-21 08:09

人鱼线的博客相似：图模型结构很像，都是采用embedding向量的形式，得到word的隐向量表达。...1.word2vec是一个无监督算法，而fasttext是一个有监督算法。 2.模型的输入层：word2vec的输入层是上下文单词；而fasttext 对应的...
coco2dx Vec2中的getNormalize 对应Point的哪个方法啊？
2015-04-06 06:08

回答 1 已采纳 GetNormalizedRectangle得到矩形，然后就可以得到4个点的坐标了。
[论文阅读] (24) 向量表征：从Word2vec和Doc2vec到Deepwalk和Graph2vec，再到Asm2vec和Log2vec(一)
2022-09-19 15:40

Eastmount的博客这篇文章主要介绍六个非常具有代表性的向量表征算法，它们有特征词向量表示、文档向量表示、图向量表示，以及两个安全领域二进制和日志的向量表征。通过类似的梳理，让读者看看这些大佬是如何创新及应用到新领域的，...
NLP之Word2Vec：Word2Vec算法的简介(CBOW和Skip-Gram及其对比)、安装、使用方法之详细攻略
2023-02-03 23:00

一个处女座的程序猿的博客 NLP之Word2Vec：Word2Vec算法的简介(CBOW和Skip-Gram及其对比)、安装、使用方法之详细攻略目录 Word2Vec算法的简介 Word2Vec的网络结构简介 Word2Vec的安装 Word2Vec的案例应用推荐文章 NLP之...
没有解决我的问题, 去提问

悬赏问题

¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。
¥15 SQL Server analysis services 服务安装失败

word2vec以及paragraph vector的原理细节？

1条回答 默认 最新

悬赏问题

1条回答默认最新