tensforflow下，multihot编码如何进行embedding

当前面临一个场景，每一个时间步内接受了若干个输入（数量不定），我想将这些输入的对应embedding值求和用作当前时刻的输入。

我做的是，将输入数据表示成为这样的格式：[batch_size, sequence_len， max_input_size]。其中第二维表示每个序列，第三维表示序列中的每个时间步的输入。由于每个序列的时间步数不同，且每一步的输入数量不同，以0值做padding。
之后，将输入进行tf.keras.layers.Embedding并对最后一维求和。

这样做我是很心虚的，因为我发现即使Embedding层的mask_zero设为True，0值做embedding后并不为0。

所以想求教，更好的对multihot进行embedding的方法。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间新星创作者: 前端开发技术领域 2024-07-24 22:46
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
针对您当前的问题，有一个更好的方法可以处理multihot输入并进行embedding。一种更常见且有效的方法是使用tf.keras.layers.Masking层来处理多个时间步中的变长序列，并确保在输入数据中使用0填充时不会对Embedding产生影响。首先，您可以将每个时间步的多个输入表示为一个稀疏矩阵，并将整个序列表示为一个稀疏张量。然后，可以使用tf.keras.layers.Embedding层将这个稀疏张量转换为稠密表示，并在最后一个维度上对它们进行求和以获得当前时刻的输入表示。以下是一个示例代码，展示了如何使用Masking层和Embedding层来处理multihot输入并进行embedding：
import tensorflow as tf # 定义输入数据 input_data = tf.constant([[1, 3, 5], [2, 0, 0], [4, 6, 0]]) # 示例输入数据 # 定义Embedding大小和维度 embedding_dim = 2 vocab_size = 7 # 创建Masking层 masking_layer = tf.keras.layers.Masking(mask_value=0) # 创建Embedding层 embedding_layer = tf.keras.layers.Embedding(input_dim=vocab_size, output_dim=embedding_dim) # 应用Masking和Embedding层 masked_input = masking_layer(input_data) embedded_input = embedding_layer(masked_input) # 对最后一个维度进行求和 summed_input = tf.reduce_sum(embedded_input, axis=-2) # 打印输出结果 print(summed_input)

在这个示例中，我们使用了Masking层来处理输入数据中的0填充值，并使用Embedding层将稀疏矩阵转换为稠密表示。最后，我们对最后一个维度进行求和以获得当前时刻的输入表示。这种方法可以确保在处理多个时间步中的变长序列时，不会受到填充值的影响。希望这个解答对您有帮助！
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Tencent-AILab-ChineseEmbedding.bin.all
2025-04-09 14:44

Tencent_AILab_ChineseEmbedding.bin腾讯 200 维 800w 词向量全量调用代码 from gensim.models import KeyedVectors # 加载.bin文件 bin_file_path = '/Volumes/Elements/Python 常用文件存放/常用大语言模型/...
向量one-hot编码和embedding
2024-06-05 19:55

weixin_50508552的博客从one-hot变成embedding的一个好处就是，编码的长度和总的词数没有关系了。相当于是把输入的每一项扩展了一个维度，映射到了embedding size大小的维度上。One-hot编码是一种将分类变量转换为二进制向量的方法，其中...
tencent-ailab-embedding-zh-d200-v0.2.0-s.bin 腾讯词向量量 200 维200 万
2025-04-09 14:40

tencent-ailab-embedding-zh-d200-v0.2.0-s.bin.all 这是腾讯 200 维 200万的词向量二进制数据通过我这里的百度网盘地址进行下载调用代码 from gensim.models import KeyedVectors # 加载.bin文件 bin_file_path ...
Transformer输入Embedding及位置编码详解
2024-07-15 23:30

python学习与分享的博客我们在本文主要介绍Transformer中的输入Embedding及位置编码。Embedding是一种将离散的输入数据（如单词、字符等）转换为连续的向量表示的方法。由于计算机无法直接处理一个单词或者一个汉字，所以需要Embedding把一...
大语言模型中one-hot编码和embedding之间的区别？
2025-02-16 00:33

大写的ZDQ的博客上下文感知：在Transformer等模型中，Embedding可结合位置编码，动态适应不同上下文（如“苹果”在“水果”和“公司”中的不同含义）。参数爆炸：若词汇表大小为V，模型输入层到第一隐藏层的权重矩阵尺寸为V × H（H...
Transformer位置编码（Position Embedding）理解
2024-03-19 19:51

Pengsen Ma的博客本文主要介绍4种位置编码，分别是NLP发源的transformer、ViT、Sw-Transformer、MAE的Position Embedding。
如何使用OpenAI文本Embedding模型构建AI系统
2024-10-17 18:35

Zilliz Planet的博客 01.Embeddings 向量与 Embedding 模型简介Embedding 向量是人工智能（AI）中的一个核心概念，它将复杂的非结构化数据（如图像、文本、视频或音频文件等）以机器可以理解和处理的数值向量来表示。这些向量能够捕捉...
【NLP 20、Encoding（编码）和 Embedding（嵌入）】
2025-02-04 17:49

L_cl的博客维度EncodingEmbedding语义保留无（仅符号化）高（捕捉语义相似性）计算开销低（静态计算）高（需训练参数）灵活性固定规则可自适应任务优化典型应用数据预处理、位置编码词向量、推荐系统、图表示学习场景推荐方法...
LLM - 位置编码 Position Embedding (Transformer/ViT/Swin/MAE) 源码实现
2022-12-26 18:24

ManonLegrand的博客 Position Embedding(位置编码)，Transformer的位置编码，2i是偶数维度，2i+1是奇数维度，pos表示序列的位置，i是维度。
类别变量的多热编码：encoding categorical variable to multihot embedding
2021-06-15 11:18

meta life的博客需求：把类别或字符串类型的特征转化为多热编码，特征是逗号、竖线等方式分割 import numpy as np import pandas as pd from scipy import sparse class MultiHotEncoder: """ Encode categorical features as...
没有解决我的问题, 去提问

tensforflow下，multihot编码如何进行embedding

2条回答 默认 最新

2条回答默认最新