TFT在测试过程中是否使用目标的真实历史值？

在TFT（Temporal Fusion Transformer）神经网络结构中，我希望模型在训练和验证时不使用历史目标值，而是直接通过协变量进行预测，因此我设置了以下参数，以避免模型使用历史目标信息：

time_varying_unknown_reals = []
time_varying_known_reals = [cov1, cov2, cov3]

但在测试时，模型仍然需要提供目标值的真实值（ground truth），而不是 NaN 或固定值。这意味着在测试过程中，模型仍然参考了目标值的真实值来进行预测。然而，在实际应用中，模型应该仅通过协变量来预测目标值，而不可能提前知道目标值的真实值。

我的问题是：
模型在训练和测试过程中是否使用了目标值的真实值？
如果确实如此，我是否应该重新定义训练过程，例如使用 Scheduled Sampling （计划采样）来控制每个训练阶段输入真实值的比例，以保证训练过程和测试过程处于完全相同的环境？（即使用自回归训练方式，让模型用自身预测的值进行后续预测）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-02-15 19:57
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解答

TFT（Temporal Fusion Transformer）神经网络结构中，确实可以在训练和验证时不使用历史目标值，而是直接通过协变量进行预测。

在 TFT 中，模型使用了自注意力机制来捕捉序列中的长期依赖关系。为了避免模型使用历史目标信息，你可以通过以下方法来实现：

在训练和验证时，使用 padding 或 masking 技术来将历史目标值设置为未知值（例如，使用 numpy.nan 或 torch.nan），这样模型就不能使用历史目标信息。
在模型中添加一个额外的 mask 层，用于屏蔽历史目标值。例如，在 transformer 的 encoder 中，可以添加一个 mask 层来屏蔽历史目标值，然后将 mask 层的输出与 encoder 的输出进行 element-wise product。

以下是一个简单的示例代码，使用 PyTorch 实现了上述方法：

import torch import torch.nn as nn class TFT(nn.Module): def __init__(self): super(TFT, self).__init__() self.encoder = nn.TransformerEncoderLayer(d_model=512, nhead=8, dim_feedforward=2048, dropout=0.1) self.decoder = nn.TransformerDecoderLayer(d_model=512, nhead=8, dim_feedforward=2048, dropout=0.1) self.mask_layer = nn.MaskedLinear(512, 512) def forward(self, input_seq, target_seq): # 添加 mask 层 mask = torch.isnan(target_seq) input_seq = input_seq * (1 - mask) target_seq = target_seq * (1 - mask) # 编码器 encoder_output = self.encoder(input_seq) # 解码器 decoder_output = self.decoder(encoder_output, target_seq) # 添加 mask 层 decoder_output = self.mask_layer(decoder_output) return decoder_output

在上面的代码中，我们添加了一个 MaskedLinear 层来屏蔽历史目标值。MaskedLinear 层将历史目标值设置为未知值，然后将其与 encoder 的输出进行 element-wise product。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

AI Agent在智能城市能源消耗预测中的实践
2025-12-29 01:14

AI云原生与云计算技术学院的博客本文的目的是探讨AI Agent在智能城市能源消耗预测中的应用，通过介绍相关的核心概念、算法原理、数学模型和实际案例，为智能城市能源消耗预测提供一种有效的解决方案。本文的范围涵盖了AI Agent的基本原理、智能城市...
短期记忆在金融风控AI中的应用：实时欺诈检测
2025-09-08 23:29

AI Native APP 开发前沿的博客金融欺诈就像“数字小偷”，总能抓住人们的疏忽——比如你刚在楼下买了杯奶茶，5分钟后就有一笔异地大额消费从你的账户流出。传统风控模型往往“记不住”这种短期行为关联，而基于短期记忆机制的AI模型（如LSTM、...
空间智能遇上AI人工智能，碰撞出的火花
2025-07-05 22:16

AI大模型应用工坊的博客传统空间智能面临的核心问题是空间数据的“三难困境”多源异构：空间数据来自卫星、传感器、社交媒体等多种渠道，格式（矢量、栅格、文本）与语义（“道路”在GIS中是线要素，在社交媒体中是文本描述）差异大；...
AI人工智能领域分类的行业影响
2025-04-28 22:25

AI智能探索者的博客本部分的目的在于详细阐述AI人工智能领域分类的行业影响，旨在为读者提供一个全面且深入的视角，了解人工智能不同领域的技术如何渗透并改变各个行业。我们将涵盖多个主要行业，包括但不限于医疗、金融、教育、交通、...
AI人工智能领域分类：行业新趋势
2025-05-27 17:55

AI应用开发实战派的博客随着科技的飞速发展，AI人工智能已经成为当今世界最具影响力的技术之一。本文的目的是全面梳理AI人工智能领域的分类，深入分析行业内的新趋势。范围涵盖了AI的主要技术领域，如机器学习、自然语言处理、计算机视觉等...
时间序列预测的深度学习方法：从LSTM到Informer与TFT——金融、气象、运维的核心预测技术
2026-01-05 20:53

九章云极AladdinEdu的博客本文系统阐述了时间序列预测领域深度学习技术的发展脉络与核心突破，聚焦LSTM、Informer与TFT三大代表性模型。文章剖析了传统时序预测的局限，详细解读了LSTM的循环架构如何捕捉长期依赖，继而深入分析了Informer...
动态神经网络在复杂时序预测任务中的优势
2025-12-29 21:17

AIGC应用创新大全的博客在当今的许多领域，如金融市场分析、气象预报、工业生产过程监控等，都面临着复杂时序预测的需求。传统的预测方法在处理具有高度非线性、动态变化和长时依赖的复杂时序数据时，往往表现不佳。动态神经网络作为一种...
Agentic AI如何破解传统提示工程的“场景适配难题”？3个实战案例
2025-08-11 22:02

AI智能探索者的博客 "场景适配难题"指的是AI系统在面对真实世界中复杂、动态、多变的应用场景时，难以持续保持高性能、高可靠性的核心挑战。泛化能力不足：在训练或设计场景下表现良好，但面对新场景或场景变化时性能急剧下降鲁棒性脆弱...
语言模型在时序推理任务中的表现
2025-10-14 11:14

AI大数据智能洞察的博客随着人工智能技术的飞速发展，语言模型在自然语言处理领域取得了显著的成果。然而，在涉及到时序推理任务时，其表现仍有待深入研究。本研究的目的在于全面评估语言模型在时序推理任务中的性能，分析其优势和不足，并...
语言模型在航天器故障诊断中的应用探索
2025-11-19 21:19

AI Python 编程的博客本文章的目的是探索语言模型在航天器故障诊断中的应用，研究如何利用语言模型处理航天器运行过程中产生的各种数据和信息，实现更高效、智能的故障诊断。范围涵盖了语言模型的基本原理、相关算法、数学模型，以及在...
神经网络在复杂系统动态推理中的应用研究
2025-10-14 11:16

AI智能架构工坊的博客本研究的目的是深入探讨神经网络在复杂系统动态推理中的应用，包括如何利用神经网络对复杂系统进行建模、预测和分析，以及如何解决应用过程中遇到的问题。研究范围涵盖了常见的神经网络模型，如多层感知机（MLP）、...
AI应用架构师实战：金融企业智能财务分析AI平台架构设计与落地
2026-01-05 00:39

光子AI的博客在金融科技飞速发展的今天，人工智能技术正深刻改变着传统财务分析模式。本文作为AI应用架构师实战指南，系统阐述了金融企业智能财务分析AI平台的完整架构设计与落地实施过程。从业务需求分析到技术架构选型，从数据...
深入解析Temporal Fusion Transformer (TFT)——多步时间序列预测的创新模型
2025-12-23 14:37

懒羊羊吃辣条的博客 TFT结合了深度学习和可解释性，使其能够在高效预测的同时，提供对模型内部决策过程的深刻理解。今天，我们将结合TFT的论文和代码实现，深入分析这一创新模型的结构、优势以及如何利用TFT解决多步时间序列预测中的...
AI在智能交通车路协同系统中的创新应用
2025-12-26 23:48

AIGC应用创新大全的博客本文的目的是全面探讨AI在智能交通车路协同系统中的创新应用，涵盖从核心概念、算法原理到实际应用案例等多个方面，为相关研究人员、工程师和决策者提供深入的技术分析和实践指导。本文共分为十个部分。第一部分为...
AI Agent在智能广告创意生成中的应用
2025-10-15 13:34

AI Native APP 开发前沿的博客 AI Agent作为人工智能领域的新兴技术，具有自主学习、推理和决策的能力，为智能广告创意生成提供了新的解决方案。本文的目的是深入探讨AI Agent在智能广告创意生成中的应用，涵盖了从核心概念、算法原理到实际应用...
AI在智能电网负载预测与平衡中的应用
2025-10-20 14:31

AI原生应用开发的博客随着全球对电力需求的不断增长以及能源结构的转型，智能电网作为未来...文章的范围涵盖了AI技术在智能电网负载预测与平衡中的各个方面，包括核心概念、算法原理、数学模型、项目实战、应用场景等。本文共分为十个部分。
我用AI做了项目的风险应对计划，把风险影响降低了50%
2026-01-01 01:25

光子AI的博客 AI驱动的项目风险应对是指利用人工智能技术（包括机器学习、自然语言处理、知识图谱、深度学习等）辅助或自动化项目风险的识别、分析、评估、预测和应对过程，以提高风险管理的效率和效果。智能风险识别：利用NLP...
AI在智能电网需求响应中的优化应用
2025-10-23 16:45

AI大数据智能洞察的博客本文的目的在于深入探讨AI在智能电网需求响应中的优化应用，涵盖了从核心概念、算法原理到实际应用案例的多个方面，为相关领域的研究人员、工程师和决策者提供全面的参考。本文将按照以下结构进行组织：首先介绍核心...
AI应用架构师带你领略AI技术在环境监测中的智能应用探索
2025-08-07 10:41

AI算力网络与通信的博客我们的目标是解决传统环境监测的3大痛点慢：手动采样+实验室分析，要等几小时甚至几天才出结果，污染扩散了才知道；粗：监测点少，只能覆盖"点"，无法看清"面"（比如一条河只有3个监测点，中间段污染了根本不知道）...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月15日

TFT在测试过程中是否使用目标的真实历史值？

3条回答 默认 最新

解答

问题事件

3条回答默认最新