embedding 矩阵是根据什么来生成的呢

在学习Word2Vec的时候

会使用到一层embedding 层来使中心词的ont-hot 矩阵降维，但是我想知道这个embedding layer里面的这个embedding 矩阵是根据什么来生成的呢？有什么论文或者谁能解释一下原理么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
林地宁宁 2022-07-20 07:17
关注
这个问题我以前也困扰过，研究半天发现结果其实特别简单，embedding 层就是一个查找表。这就是说，如果你有 10 个 token，也就是有 10 种 one-hot 编码，那么每一个 one-hot 都对应一个 embedding 结果，给他全部记录下来就好，之后靠着 BP 算法，能自动把这些 embedding 学习到。

对应到 pytorch 的源码，更是简单，对应源码 https://github.com/pytorch/pytorch/blob/5b03ff0a09d43d721067e39da10aa23edc6997cd/aten/src/ATen/native/Embedding.cpp#L14-L29 中 14~29 行，你会发现他就一个 index_select 函数，说明 embedding 里面的矩阵就是一个查找表，根本连乘法运算都没有：

Tensor embedding(const Tensor & weight, const Tensor & indices, int64_t padding_idx, bool scale_grad_by_freq, bool sparse) { auto indices_arg = TensorArg(indices, "indices", 1); checkScalarType("embedding", indices_arg, kLong); // TODO: use tensor.index() after improving perf if (indices.dim() == 1) { return weight.index_select(0, indices); } auto size = indices.sizes().vec(); for (auto d : weight.sizes().slice(1)) { size.push_back(d); } return weight.index_select(0, indices.reshape(-1)).view(size); }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容
cscs885 2022-07-29 08:02

感谢！那这样我还有一个问题，就是这个“embedding层的查找表”又是如何初始化生成的呢？因为最开始总得有一个初始化的表才能用BP算法更新这个表吧

赞

回复

编辑

预览

轻敲空格完成输入
显示为

卡片

标题

链接

回复

按下Enter换行，Ctrl+Enter发表内容
林地宁宁回复 cscs885 2022-07-29 08:42

这个可以看一看 embedding 层的 python 包装，其中的 .weight 就是查找表，事实上就是通过一个中心为 0，方差为 1 的正态分布随机取样的。还望采纳答案。

1

回复

编辑

预览

轻敲空格完成输入
显示为

卡片

标题

链接

回复

按下Enter换行，Ctrl+Enter发表内容
林地宁宁回复 cscs885 2022-07-29 08:45

可以看 embedding 的实现，我怀疑初始化的过程不同框架可能不一样，在 pytorch 中就是简单的用中心为 0，方差为 1 的正态分布随机采样得到的初始参数。答案还望采纳。

1

回复

编辑

预览

轻敲空格完成输入
显示为

卡片

标题

链接

回复

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

embedding的原理 matlab python 深度学习
2022-08-14 13:34

回答 2 已采纳 embedding的原理你可以去搜cbow和skip-gram，说白了就是用两边的字或词预测中间的，或者用中间的字或词预测两边的。第一，每个文本，我们可以取字也可以取词，以字为例，先生成字典{"以":
文本数据为阿拉伯数字和运算符号怎么做embedding呢 nlp word2vec 语言模型
2023-03-30 02:43

回答 1 已采纳文章：深度学习中，embedding如何理解？中也许有你想要的答案，请看下吧
word embedding区分大小写吗，尤其是首字母 actionscript c语言 typescript
2023-03-09 13:07

回答 1 已采纳该回答引用ChatGPT 在 Word embedding 中，通常会将单词的大小写视为不同的单词，并分别对其进行编码，即大小写形式不同的单词会被视为不同的词汇，这是因为同一个单词的不同大小写形式可
什么是机器学习领域中的 Embedding
2024-11-05 11:15

汪子熙的博客通过 Embedding，我们可以捕捉到数据之间的潜在关系和语义信息，从而更好地实现各种智能化任务。然而，Embedding 的质量受到训练语料、上下文和模型结构等多方面的影响，如何提升其泛化能力和表达能力是未来研究的一...
tensorflow 怎么进行变长序列的embedding？ tensorflow 数据挖掘深度学习神经网络自然语言处理
2020-09-11 08:23

回答 1 已采纳 https://blog.csdn.net/qq_27825451/article/details/88991529
请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 13:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
GCN图表示是无监督还是有监督？人工智能深度学习
2022-05-15 02:46

回答 2 已采纳看下游任务，你如果做分类可以是无标签，只训练embedding可以无标签，看下摘要就知道，GCN半监督准确率会高些
什么是embedding？详解
2024-07-11 02:12

知世不是芝士的博客简单来说，embedding就是用一个低维的向量表示一个物体，可以是一个词，或是一个商品，或是一个电影等等。这个embedding向量的性质是能使距离相近的向量对应的物体有相近的含义，比如 Embedding(复仇者联盟)和...
深度学习网络中的num_hiddens代表什么，此处为什么是4*num_hiddens？ pytorch 深度学习自然语言处理
2022-02-17 02:49

回答 2 已采纳 https://pytorch.org/docs/stable/generated/torch.nn.LSTM.html#torch.nn.LSTM先看下LSTM输出的通道数[seq_length,
gan网络/python/深度学习/有偿 bert python 生成对抗网络
2023-01-01 11:31

回答 5 已采纳 TypeError: init() got an unexpected keyword argument 'nhidden'TypeError:init（）获得了意外的关键字参数“nhidden” 根
如下该怎么解决tensorflow报错问题呢 keras python tensorflow
2023-04-18 03:09

回答 6 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：这个报错信息意味着在加载 SavedModel 时，无法找到与输入张量匹配的适当函数。每个已保存的函数都只接受特定的输入函数签名，并且当 Saved
AIGC系列之一-一文理解什么是Embedding嵌入技术
2024-06-23 13:22

人工智能大模型讲师培训咨询叶梓的博客使用通俗易懂的语言来表达embedding技术，是使用一种模型生成方法，将非结构化的数据，例如文本、图片、视频等数据映射成向量数据，向量都是由数值表达的向量，向量可以被计算机直接处理。GloVe（Global Vectors for...
一文读懂Embedding技术
2024-06-12 07:45

爱喝白开水a的博客二、AI大模型视频教程三、AI大模型各大学习书籍四、AI大模型各大场景实战案例五、结束语学习AI大模型是当前科技发展的趋势，它不仅能够为我们提供更多的机会和挑战，还能够让我们更好地理解和应用人工智能技术...
词向量Word Embedding原理及生成方法
2021-05-24 05:44

个推技术的博客前言 Word Embedding是整个自然语言处理（NLP）中最常用的技术点之一，广泛应用于企业的建模实践中。...什么是Word Embedding 一句话概述，Word Embedding即词向量，是一种函数映射关系。我们知道，在机器学习中
【人工智能】深入浅出：大语言模型必不可少的技术——Embedding简介(9)
2024-02-05 15:50

魔道不误砍柴功的博客在当今人工智能的浪潮中，大型语言模型扮演着愈发重要的角色，而其中的Embedding技术更是这一领域的核心。你是否好奇过在深度学习模型中，是如何将文字转化为数字表示，实现对语义的把握的呢？本文将为你揭开这个...
没有解决我的问题, 去提问