meta-embedding复现问题

在论文中，先取出n个任务，然后对每个任务，先计算在D_[i]^a上的损失，然后计算在D_[i]^a上更新后的模型参数，并使用该更新后的参数计算在D_[i]^b上的损失，最后将这两个损失进行加权求和，得到该任务的损失。将n个任务的损失加和去更新模型的参数。
但是在看网上的复现，发现并不符合这个流程：

复现1：

复现2：

问题：
1. 他们都是将整个batch内的数据，当做一个任务，这是为什么？
2. 如果采用论文中的顺序，如何解决耗时过高的问题？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2023-12-25 10:30
关注
引自微信小程序：皆我百晓生：

他们将整个batch内的数据视为一个任务是为了进行元学习。在元学习中，每个任务都包含了一组数据，通过在不同的任务上进行学习，模型可以学到泛化能力更强的表示。在算法1和算法2中，每个batch内的数据被看作是一个任务，通过在这个任务上进行学习，优化模型的参数，以使模型能够更好地适应不同任务的数据。

论文中提到的顺序采样方案确实可能导致耗时过高的问题。为了解决这个问题，可以采用一些加速方法，例如使用并行计算来同时处理多个任务，或者使用近似的优化算法来减少计算开销。另外，还可以对顺序采样进行优化，例如通过算法1中的随机采样n个任务，或者通过算法2中的分批采样，每次处理一批任务来减少耗时。这样可以有效地提高训练效率。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

2025年RAG技术最近进展-PathRAG论文文章解读和算法复现
2025-04-07 22:36

Andyxzq_main的博客为了更好地捕获文本数据库之间的内在依赖关系和结构化关系，研究人员提出将文本信息组织成一个索引图，称为基于图RAGGraph-RAG存在对扁平数据表示的依赖和不充分的上下文感知，这可能导致碎片化的答案，无法捕获复杂...
【Pytorch基础教程40】DLRM推荐算法模型部署
2023-06-01 00:01

山顶夕景的博客一、DLRM模型 DLRM是2020年meta提出的工业界推荐算法模型，模型结构非常简单，也没用到什么attention机制等的东西，更多是注重在推荐系统稀疏特征场景下的落地： sparse feature：离散的类别特征，通过embedding层...
世界独一无二常用算法体系：跨领域通用性、创新性及应用边界研究
2025-11-04 11:33

黑科技Python的博客经典混合并行搜索算法），本文揭示了其“独一无二性”的本质来源（如仿生机制的深度迁移、复杂系统交互的精准建模、非传统度量空间的结构适配、计算资源的协同增强），并探讨了其在实际应用中的优势边界与未来拓展...
PGL 系列（七）metapath2vec
2023-02-09 17:06

_yuki_的博客 paddle 2.4.0 metapath2vec 复现
6-PACK论文学习及复现记录
2022-08-04 11:14

momo_vv的博客 6-PACK论文复现
一文通透ACT——斯坦福ALOHA团队推出的动作分块算法：基于CVAE一次生成K个动作且做时间集成
2024-01-08 12:21

v_JULY_v的博客至于ACT的代码剖析、部署实践，请见下一篇文章《逐行解读ACT：斯坦福Mobile Aloha之动作分块算法ACT的代码剖析、训练部署》第一部分 ALOHA + ACT 1.1 ALOHA + ACT解决现有机器人昂贵且难以做精确任务的问题 ...
授人以渔：分享我的算法学习经验
2022-01-30 11:05

kaiyuan_sjtu的博客前言看到知乎上有很多人提问“怎么学习算法”？对于这个问题，我想我是非常有资格回答的，因为我不是计算机科班出身，工作几年后通过自学，不仅转行做了推荐算法，而且我的算法水平无论是在公司内部还是...
知乎高赞：算法工程师技术路线图
2022-09-09 22:44

「已注销」的博客这是一份写给公司算法组同事们的技术路线图，其目的主要是为大家在技术路线的成长方面提供一些方向指引，配套一些自我考核项，可以带着实践进行学习，加深理解和掌握。内容上有一定的通用性，所以也分享到知乎...
一文通透让Meta恐慌的DeepSeek-V3：在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解)
2025-01-27 09:00

v_JULY_v的博客最后，再强调下，上述558万美元的成本仅包括DeepSeek-V3的正式训练，不包括与架构、算法或数据的先前研究和消融实验相关的成本 1.1.2 在国内也能引领世界级前沿在过去风起云涌的两年，我们见过了很多华人还海外大...
元学习入门详解（MAML算法及Reptile算法复现）
2020-08-26 14:25

pinn山里娃的博客元学习以及常用的元学习算法介绍
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 12月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月22日
展开全部

meta-embedding复现问题

5条回答 默认 最新

问题事件

5条回答默认最新