spark与hive版本问题? 本机正常运行,服务器上报错.

在本机正常运行, 服务器上运行报错,spark版本2.3.1 hive版本1.1.0

错误信息:

org.apache.thrift.TApplicationException: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.thrift.TApplicationException.read(TApplicationException.java:111)
    at org.apache.thrift.TServiceClient.receiveBase(TServiceClient.java:79)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.recv_OpenSession(TCLIService.java:156)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.OpenSession(TCLIService.java:143)
    at org.apache.hive.jdbc.HiveConnection.openSession(HiveConnection.java:574)
    at org.apache.hive.jdbc.HiveConnection.<init>(HiveConnection.java:194)
    at org.apache.hive.jdbc.HiveDriver.connect(HiveDriver.java:105)
    at java.sql.DriverManager.getConnection(DriverManager.java:664)
    at java.sql.DriverManager.getConnection(DriverManager.java:247)
    at com.sz.mysql.SyncMysql.getHiveConnection(SyncMysql.java:128)
    at com.sz.mysql.SyncMysql.main(SyncMysql.java:72)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:904)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
java.sql.SQLException: Could not establish connection to jdbc:hive2://192.168.67.145:10000/zlgx_ods: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.hive.jdbc.HiveConnection.openSession(HiveConnection.java:586)
    at org.apache.hive.jdbc.HiveConnection.<init>(HiveConnection.java:194)
    at org.apache.hive.jdbc.HiveDriver.connect(HiveDriver.java:105)
    at java.sql.DriverManager.getConnection(DriverManager.java:664)
    at java.sql.DriverManager.getConnection(DriverManager.java:247)
    at com.sz.mysql.SyncMysql.getHiveConnection(SyncMysql.java:128)
    at com.sz.mysql.SyncMysql.main(SyncMysql.java:72)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:904)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: org.apache.thrift.TApplicationException: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.thrift.TApplicationException.read(TApplicationException.java:111)
    at org.apache.thrift.TServiceClient.receiveBase(TServiceClient.java:79)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.recv_OpenSession(TCLIService.java:156)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.OpenSession(TCLIService.java:143)
    at org.apache

代码:


package com.sz.mysql;

import org.apache.spark.sql.*;

import java.sql.*;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

/**
 * @author nanlei
 * @date 2021年05月10日
 */
public class SyncMysql {


    public static void main(String[] args) throws ParseException {


        try {
            //日期 20210101
//            String date = args[0];
            String date = "20210728";

            System.setProperty("HADOOP_USER_NAME", "hdfs");
            SparkSession spark = SparkSession
                    .builder()
                    .config("mapreduce.fileoutputcommitter.marksuccessfuljobs", false)
                    .config("parquet.enable.summary-metadata", false)
                    .appName("SyncMysql")
                    .master("local[*]")
                    .getOrCreate();

            Connection conn = getMysqlConnection();
            Statement stat = conn.createStatement();
            ResultSet rs = stat.executeQuery("select * from sync_mysql_to_hive");
            while (rs.next()) {
                String src_path = rs.getString("src_path");
                String target_parh = rs.getString("target_parh");
                String table_name = rs.getString("table_name");
                String date_field = rs.getString("date_field");
                String date_format = rs.getString("date_format");
                String username = rs.getString("username");
                String password = rs.getString("password");
                System.out.println("参数列表:");
                System.out.println("src_path: " + src_path);
                System.out.println("target_parh: " + target_parh);
                System.out.println("table_name: " + table_name);
                System.out.println("date_field: " + date_field);
                System.out.println("date_format: " + date_format);
                System.out.println("username: " + username);
                System.out.println("password: " + password);

                String hdfsPath = (target_parh + "/" + date.substring(0, 4) + "/" + date.substring(4, 6) + "/" + date.substring(6, 8)) + "/";

                SimpleDateFormat srcFormat = new SimpleDateFormat("yyyyMMdd");
                Date d = srcFormat.parse(date);
                SimpleDateFormat targetFormat = new SimpleDateFormat(date_format);
                String targetDate = targetFormat.format(d);

                Dataset<Row> row = getMetaDataset(spark, src_path, table_name, username, password);
                Dataset<Row> queryRow = row.where(date_field + " like '%" + targetDate + "%'");

                String[] columnNames = queryRow.columns();
                Column[] columns = new Column[columnNames.length];
                for (int i = 0; i < columnNames.length; i++) {
                    columns[i] = queryRow.col(columnNames[i]).cast("string");
                }
                Dataset<Row> newRow = queryRow.select(columns);

                newRow.write().mode(SaveMode.Overwrite).parquet(hdfsPath);
                Class.forName("org.apache.hive.jdbc.HiveDriver");
                Connection hiveCon = DriverManager.getConnection("jdbc:hive2://192.168.67.145:10000/zlgx_ods", "hive", "hive");
                Statement hiveStat = hiveCon.createStatement();
                String template = "alter table zlgx_ods.%s add if not exists partition (year = '%s' ,month = '%s' , day ='%s' ) location  '%s'";
                String sql = String.format(template, table_name, date.substring(0, 4), date.substring(4, 6), date.substring(6, 8), hdfsPath);
                System.out.println("执行sql--->" + sql);
                hiveStat.execute(sql);
                System.out.println("关联hive完成");
                hiveStat.close();
                hiveCon.close();
            }
            rs.close();
            conn.close();
            spark.close();


        } catch (Exception e) {
            e.printStackTrace();
        }

    }


    public static Dataset<Row> getMetaDataset(SparkSession spark, String jdbcUrl, String tableName, String username, String password) {
        Dataset<Row> conosequence = null;
        try {
            conosequence = spark.read().format("jdbc").option("delimiter", ",")
                    .option("header", "true")
                    .option("url", jdbcUrl)
                    .option("dbtable", tableName)
                    .option("user", username)
                    .option("password", password)
                    .load();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return conosequence;
    }

    public static Connection getMysqlConnection() {
        Connection con = null;
        try {
            Class.forName("com.mysql.cj.jdbc.Driver");  //注册数据库驱动
            String url = "jdbc:mysql://192.168.67.189:3306/etl_2020?useSSL=false&characterEncoding=utf-8&serverTimezone=UTC";  //定义连接数据库的url
            con = DriverManager.getConnection(url, "wangchen", "wc-jrgx");  //获取数据库连接
            System.out.println("数据库连接成功！");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return con;  //返回一个连接
    }


}

maven配置:

    <dependencies>

        <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>2.3.1</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.11</artifactId>
            <version>2.3.1</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/com.esotericsoftware/kryo -->
        <dependency>
            <groupId>com.esotericsoftware</groupId>
            <artifactId>kryo</artifactId>
            <version>4.0.2</version>
        </dependency>

        <!--mysql-->
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.25</version>
        </dependency>
        <!-- hive依赖 -->
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>1.1.0</version>
        </dependency>
        <!-- 中文分词器 -->
        <dependency>
            <groupId>cn.bestwu</groupId>
            <artifactId>ik-analyzers</artifactId>
            <version>5.1.0</version>
        </dependency>
    </dependencies>

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-星云 2021-07-30 20:52
关注
可参考：https://blog.csdn.net/zt15732625878/article/details/85245731
看客户端的 hive-jdbc的version 和hive Server的version是否一致
如有帮助，望采纳

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
hive on spark运行sql报错 hive spark 有问必答
2021-09-28 16:58

回答 2 已采纳该问题由hive与spark两者版本不兼容导致的，具体的解释，在官网是有说明的：Hive on Spark is only tested with a specific version of Spar
Atlas Spark SQL血缘分析，Hive Hook
2024-05-25 17:45

在本主题中，我们将深入探讨如何使用Apache Atlas进行Spark SQL的血缘分析，并结合Hive Hook来实现这一功能。首先，Apache Atlas 提供的血缘分析功能可以帮助用户理解数据的来源和去向，这对于数据治理和数据质量...
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
Hive on Spark配置问题 hive spark
2022-12-08 11:36

回答 3 已采纳 hive-seit.xml文件里面必须要添加设置执行引擎为spark
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
Hive引擎替换为Spark（Hive on Spark）
2020-05-18 22:44

Ethan130的博客 Hive引擎替换为Spark（Hive on Spark）1、背景2、Hive引擎选择3、三种引擎如何切换引擎？4、hive on spark配置集群模式5、hive on spark参数调优6、结束语 1、背景 Hive on Spark是由Cloudera发起，由Intel、MapR等...
hive | o.a.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out flink hive spark
2021-12-15 08:56

回答 2 已采纳 [HIVE-22196] Socket timeouts happen when other drivers set DriverManager.loginTimeout - ASF JIRA程序中使
spark通过jdbc读取hive的表报错，我是在zeppelin里运行的 hive spark
2017-06-06 08:21

回答 1 已采纳在目前Hive 1.2的JDBC版本里面，使用它会报错：`java.sql.SQLException: Method not supported at org.apache.hive.jdbc.Hiv
hive on spark 打开文件过多错误 hadoop hive spark
2022-05-19 19:51

回答 3 已采纳你用的beeline方式连接的吧 beeline连接是有限的当连接超出的时候就会出问题你尝试一下直接连接hivecli 应该会好一点
423页15万字XX大数据应用专题开发技术方案.docx
2023-10-11 11:59

系统基于 Hadoop+Hive+Spark，可以根据业务增涨，支持线性扩展，搭建分布式数据仓库，采用 hdfs+hive 存储和管理业务数据，利用 spark 内存计算框架，高效分析数据。分布式核心域节点拓扑当前在“分布式核心域”实际...
关于#大数据#的问题，如何解决？ hive java 大数据
2023-02-21 09:58

回答 2 已采纳你去看一下这个job的日志报的什么错误
广西大数据应用专题开发技术方案-标包3.docx
2023-11-05 12:38

本文档概述了广西大数据应用专题开发技术方案的第三个标包，主要介绍了大数据设计架构、分布式模块设计、插件化程序开发、多样化数据采集系统、Docker 容器部署、ArcGIS 二次开发等技术方案。 titre：广西大数据...
大数据技术与实践学习
2024-06-17 23:40

@业精于勤荒于嬉的博客 大数据技术与实践期末复习生态系统每一张图片都值得思考，理清楚到底是什么！ 1.结构化数据（数据库里面的）：Sqoop（效率比较慢/隔一段时间抽取一次） 2.半结构化或者非结构化数据：Flume/Logstach（实时/消息...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 3月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月30日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

spark与hive版本问题? 本机正常运行,服务器上报错.

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新