每天输出的是t-1的数据，万一如果t-1有时候会运行失败，若运行失败时，让t-2的数据写到t-1(标签-hive)

这里有一张hive表，每天输出的是t-1的数据，万一如果t-1有时候会运行失败，里面就没有数了，为了保证兜底，若运行失败时，让t-2的数据写到t-1，让他里面先存t-2的数据，请问怎么实现？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-18 19:03
关注
引自免费微信小程序：皆我百晓生

为了解决这个问题，我们可以创建一个Hive查询脚本，它会在插入t-1分区数据之前检查t-1分区是否存在数据。如果没有数据，则将t-2分区的数据移动到t-1分区。这是一个简单的SQL示例，展示了如何实现这个逻辑：

首先，我们需要确保有一个名为your_table的Hive表，并且它有日期相关的分区列，比如report_date。

CREATE TABLE your_table ( -- 描述你的其他字段 ) PARTITIONED BY (report_date STRING);

接下来，创建一个HQL（Hive SQL）脚本来处理这个情况。在这个示例中，我们将使用IF NOT EXISTS和INSERT OVERWRITE语句。假设我们正在处理今天的日期（t），昨天的日期是(t-1)，前天的日期是(t-2)。

-- 获取当前日期 SET today = '2023-04-07'; -- 替换为实际的当天日期 -- 检查t-1分区是否存在数据 SELECT COUNT(*) FROM your_table WHERE report_date = date_sub(CURRENT_DATE, INTERVAL 1 DAY); -- 如果t-1分区不存在数据，将t-2分区的数据移动到t-1分区 INSERT OVERWRITE TABLE your_table PARTITION (report_date=date_sub(CURRENT_DATE, INTERVAL 1 DAY)) SELECT * FROM your_table WHERE report_date = date_sub(CURRENT_DATE, INTERVAL 2 DAY) WHERE NOT EXISTS (SELECT * FROM your_table WHERE report_date = date_sub(CURRENT_DATE, INTERVAL 1 DAY)); -- 正常插入t分区的数据 INSERT INTO TABLE your_table PARTITION (report_date=$today) SELECT * FROM your_source_data; -- 替换为实际的数据源表名

你需要根据实际情况替换your_table、your_source_data以及日期字符串。这个查询首先获取当前日期，然后检查t-1分区是否有数据。如果没有数据，它将从t-2分区选择所有记录并将其插入到t-1分区。最后，正常插入t分区的数据。

注意：这个方法依赖于你有一个定期更新的源数据表your_source_data。这个过程应该在每天的批处理作业中执行，以确保数据的准确性。

如果你想要自动化这个过程，可以考虑使用Oozie、Airflow或其他工作流管理系统来调度这个HQL脚本的执行。
解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

OpenVLA-OFT——微调VLA时加快推理的三大关键设计：支持动作分块的并行解码、连续动作表示以及L1回归(含输入灵活化及对指令遵循的加强)
2025-04-04 20:45

v_JULY_v的博客下文《1.3 微调三大关键设计之外的：额外输入输出、FiLM》会再次提到——一个带有GELU激活函数的3层MLP将图像输入(嵌入)投影到语言模型嵌入空间且通过带有 GELU 激活的2层MLP将机器人本体状态投影到语言嵌入空间 ...
一文总览OpenAI o1相关的技术：从CoT、Quiet-STaR、Self-Correct、Self-play RL、MCTS等到类o1模型rStar-Math
2024-10-12 18:37

v_JULY_v的博客可能是去年写或讲的关于ChatGPT原理的文章和课程，影响力太大了导致自从OpenAI o1出来后，每过两天，就有朋友问，“校长 o1啥时候出解读或课程”，实在是各个大模型项目上的事情太多，加之近期一直在抠机器人...
06-SNAP处理Sentinel-1 IW SLC数据（极化SAR预处理）
2021-01-07 09:26

晚秋10的博客转载自：...SNAP处理Sentinel-1 IW SLC数据（极化SAR预处理）前言基本认识 Sentinel-1数据产品模式简介 Sentinel-1数据文件名命名规则 Sent
uniapp - HBuilder提示adb: failed to install X Failure [INSTALL_ARSE_FAILED_NOT_APK:X（安装HBuilder调试基座失败）
2025-08-28 15:43

架构小张爱code的博客安装HBuilderX调试基座失败，uniapp APP运行到手机adb: failed to install，Uniapp提示adb，uniapp ios 真机调试报错 uniapp安卓调试，Uniapp安装不了基座，手动安装基座，正在安装手机端HBuilder调试基座，点击运行...
ChatGLM两代的部署/微调/实现：从基座GLM、ChatGLM的LoRA/P-Tuning微调、6B源码解读到ChatGLM2的微调与实现
2023-03-31 16:40

v_JULY_v的博客随着『GPT4多模态/Microsoft 365 Copilot/Github Copilot X/ChatGPT插件』的推出，绝大部分公司的技术产品服务，以及绝大部分人的工作都将被革新一遍类似iPhone的诞生大家面向iOS编程有了App Store现在有了...
七月论文审稿GPT第2版：用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4
2023-11-02 15:27

v_JULY_v的博客如此前这篇文章《》中的第三部分所述，对于论文的摘要/总结、对话、翻译、语法检查而言，市面上的学术论文GPT的效果虽暂未有多好，可至少还过得去，而如果涉及到论文的修订/审稿，则市面上已有的学术论文GPT的效果则...
ORB-SLAM2代码详解
2022-05-01 00:06

大江东去浪淘尽千古风流人物的博客 ORB-SLAM2代码详解01_ORB-SLAM2代码运行流程1 运行官方Demo1.2. 阅读代码之前你应该知道的事情1.2.1 变量命名规则1.3 理解多线程1.3.1 为什么要使用多线程?1.3.2 多线程中的锁1.4 SLAM主类`System`1.4.1 System`类...
ENVI + sentinel-2数据 + ArcGIS + 监督分类及变化检测
2022-11-19 17:27

幽.白的博客内含5中操作的主要流程，分别是sentinel-2的下载过程、哨兵二号L1C数据Sen2Cor大气校正、SNAP的裁剪及格式转换、ENVI的监督分类、ENVI的变化检测。文章主要内容是完成某门课程的某个作业的主要流程，是一篇记录文章...
详解各类以太网标准10BASE-T/100BASE-T4/100BASE-FX/1000BASE-X等
2020-05-01 20:40

leon1741的博客以太网有两类：第一类是经典以太网，第二类是交换式以太网，使用了一种称为交换机的设备连接不同的计算机。经典以太网是以太网的原始形式，运行速度从3-10 Mbps不等；而交换式以太网正是广泛应用的以太网，可运行在...
SSL/TLS协议信息泄露漏洞(CVE-2016-2183)【原理扫描】处理
2020-12-30 14:56

羌俊恩的博客 TLS, SSH, IPSec协商及其他产品中使用的DES及Triple DES密码存在大约四十亿块的生日界，这可使远程攻击者通过Sweet32攻击，获取纯文本数据。风险级别：低该漏洞又称为SWEET32（https://sweet32.info）是对较旧的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月18日

每天输出的是t-1的数据，万一如果t-1有时候会运行失败，若运行失败时，让t-2的数据写到t-1(标签-hive)

4条回答 默认 最新

问题事件

4条回答默认最新