Gadaite 2022-03-27 14:34 采纳率: 100%

已结题

为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样

问题遇到的现象和发生背景

问题现象使用pyspark，dbeaver以及hive命令对hive表的数据进行插入和删除的时候，有些方式不一定能够正常执行
hive表为未进行分区的表
删除使用的是筛选内容重写的方式

问题相关代码

情景1：插入数据的时候：
sparkSQL使用语句：

spark.sql("""
    INSERT INTO hive_test_one.djia_table(`date`, `open`, high, low, `close`, volume, adj_close) VALUES('2022-03-27', 0, 0, 0, 0, 0, 0)
""")

dbeaver上使用语句：

INSERT INTO hive_test_one.djia_table
(`date`, `open`, high, low, `close`, volume, adj_close)
VALUES('2022-03-27', 0, 0, 0, 0, 0, 0);

hive命令行使用语句：

INSERT INTO hive_test_one.djia_table(`date`, `open`, high, low, `close`, volume, adj_close) VALUES('2022-03-27', 0, 0, 0, 0, 0, 0);

情景2：删除数据的时候：
sparkSQL使用语句：

spark.sql("""
    spark.sql("""insert overwrite table djia_table select * FROM DJIA_table where Date != '2022-03-27'""")
""")

dbeaver上使用语句：

insert overwrite table djia_table  select * from djia_table WHERE `date` != '2022-03-27';

hive命令行使用语句：

insert overwrite table djia_table  select * from djia_table WHERE `date` != '2022-03-27';

运行结果及报错内容

情景1：dbeaver，hive命令行执行都通过，但是SparkSQL上报错：
SparkSQL报错内容如下：

pyspark.sql.utils.ParseException: "\nmismatched input '`date`' expecting {'(', 'SELECT', 'FROM', 'VALUES', 'TABLE', 'INSERT', 'MAP', 'REDUCE'}(line 3, pos 5)\n\n== SQL ==\n\n    INSERT INTO hive_test_one.djia_table\n    (`date`, `open`, high, low, `close`, volume, adj_close)\n-----^^^\n    VALUES('2022-03-27', 0, 0, 0, 0, 0, 0)\n"

情景2：SparkSQL，dbeaver上执行通过，但是hive命令行报错：
hive命令行报错信息如下：

hive> use hive_test_one;
OK
Time taken: 0.021 seconds
hive> insert overwrite table djia_table select * FROM DJIA_table where date != '2022-03-27';
NoViableAltException(339@[412:1: atomExpression : ( constant | ( intervalExpression )=> intervalExpression | castExpression | extractExpression | floorExpression | caseExpression | whenExpression | ( subQueryExpression )=> ( subQueryExpression ) -> ^( TOK_SUBQUERY_EXPR TOK_SUBQUERY_OP subQueryExpression ) | ( functionName LPAREN )=> function | tableOrColumn | expressionsInParenthesis[true] );])
     ....................................................
FAILED: ParseException line 1:70 cannot recognize input near 'date' '!=' ''2022-03-27'' in expression specification

我的解答思路和尝试过的方法

情景一：将SparkSQL的语句改为如下

spark.sql("""INSERT INTO hive_test_one.djia_table 
VALUES('2022-03-27', 0, 0, 0, 0, 0, 0)
""")

我想要达到的结果
理解为什么不同的方式操作hive表结果不一样

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
DarkAthena ORACLE应用及数据库设计方案咨询师 2022-03-27 14:49
关注
把情景一改成这样试试
spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume, adj_close) VALUES('2022-03-27', 0, 0, 0, 0, 0, 0) """)

尝试不要使用date这种关键词作为字段名

以上主要是考虑重音符号及sql保留关键词在各sql语法解析中的兼容性问题
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样 hive spark sql 有问必答
2022-03-27 14:34

回答 2 已采纳把情景一改成这样试试spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume,
请问大家为什么我连接hive无法执行插入语句呀 hive 大数据数据库
2023-03-14 10:08

回答 1 已采纳 job的执行错误，看下你的脚本代码，去掉可能出错的部分再试试看
DolphinScheduler调用Shell脚本，从ES拉取数据到Hive。 elasticsearch hive
2022-10-21 17:22

回答 2 已采纳这是elasticsearch-hadoop RestClient部分的源码,https://github.com/elastic/elasticsearch-hadoop/blob/main/mr
dbeaver配置hive数据库驱动jar包
2022-08-10 17:32

只需要一个jar包，不需要大量的hadoop相关jar包
请问 dbeaver 用sql语句新建表需要重启dbeaver软件才能看到表结构，怎么办 oracle sql 测试工具
2022-09-05 11:42

回答 1 已采纳在左侧的导航树上，点击鼠标右键，刷新
使用DBeaver想在表中导入excel的数据只能导入列 mysql
2022-09-24 23:23

回答 3 已采纳字符集不匹配，'\xE5\xBC\xA0\xE9\x80\x9A'是UTF8字符集的"张通" ,所以至少你表的这个字段得是UTF8字符集的
DBeaver查询结果中文乱码 mysql sql 数据库开发
2022-06-07 13:34

回答 3 已采纳在连接配置那里，检查一下这玩意新建一个utf-8编码的sql脚本文件，然后手动输入包含有中文的代码，再用dbeaver打开这个脚本，执行它。你问题里描述的“文本文件编码改成utf8”，这个操作在此
DBeaver链接hive驱动包下载： hive-jdbc-uber-2.6.5.0-292.jar
2023-05-17 14:44

DBeaver链接hive驱动包下载： hive-jdbc-uber-2.6.5.0-292.jar
启动hiveserver2，启动beeline之后卡住了 hive mysql 大数据有问必答
2021-11-23 14:27

回答 1 已采纳你为什么不进行后台启动，只需要在后面添加一个&hiveserver2 & 启动客户端 [root@hadoop10 ~]# beelinebeeline> !connect jdbc:hive2
数据库的可视化工具如dbeaver，Navicat创建的数据库，在命令行里看不到 java mysql 数据库
2023-03-03 16:36

回答 2 已采纳似乎是mysql版本的问题吧，卸载换另一个版本就不会有这个问题
Dbeaver ce打不开了 java
2022-04-16 14:38

回答 1 已采纳这个数据库可视化工具垃圾得很，我也只有看达梦的数据才用它，你可以换个其他版本试试
大数据hive连接工具dbeaver-5.3和对应驱动
2019-02-01 22:13

大数据hive的一个连接工具dbeaver,以及连接驱动,适合idea开发,连接cdh集群hive使用
dbeaver 连接 database postgresql
2021-05-14 17:53

回答 1 已采纳一是看看网络通没通，防火墙关没关。二是看看数据库的配置是否配置相应的IP、端口等信息了。配置方法根据数据库软件而定。如有帮助，请采纳一下，谢谢。
界面工具DBeaver连接hive驱动jar包
2021-02-23 13:11

个人认为DBeaver还是很强大，很好用的，它支持多种数据库的...该资源为DBeaver连接hive的jar包驱动，只要hive配置文件已配置完成，编辑添加此驱动，即可成功连接hive。通过界面工具查看分析hive里的数据要方便的多哦！
DBeaver 21.2 安装包+hive驱动+impala驱动+配置图.rar
2021-09-09 09:32

dbeaver-ce-21.2.0.exe; hadoop-common-2.6.0-cdh5.7.0.jar hive-jdbc-1.1.0-cdh5.4.5-standalone.jar ImpalaJDBC41.jar ImpalaJDBC42.jar
DBeaver（含hive驱动）
2019-05-31 01:28

连接hive的工具还有很多，使用DBeaver的原因是因为我之前连接关系型数据库使用的就是DBeaver，正好DBeaver支持连接hive，且个人认为DBeaver确实挺好用的，支持各种关系型数据库，如连接Oracle数据库不需要像plsql...
DBeaver连接及hive数据库语句
2022-07-28 16:26

卜凡.的博客代码】DBeaver连接及hive数据库语句。
Dbeaver连接Hive数据库操作指导
2023-02-28 19:03

闲小憨的博客由于工作需要，当前分析研究的数据基于Hadoop的Hive数据库中，且Hadoop服务端无权限进行操作且使用安全模式，在研究了Dbeaver、Squirrel和Hue三种连接Hive的工具，在无法绕开useKey认证的情况下，只能使用DBeaver...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月27日

悬赏问题

¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集