spark与hive版本问题? 本机正常运行,服务器上报错.

在本机正常运行, 服务器上运行报错,spark版本2.3.1 hive版本1.1.0

错误信息:

org.apache.thrift.TApplicationException: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.thrift.TApplicationException.read(TApplicationException.java:111)
    at org.apache.thrift.TServiceClient.receiveBase(TServiceClient.java:79)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.recv_OpenSession(TCLIService.java:156)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.OpenSession(TCLIService.java:143)
    at org.apache.hive.jdbc.HiveConnection.openSession(HiveConnection.java:574)
    at org.apache.hive.jdbc.HiveConnection.<init>(HiveConnection.java:194)
    at org.apache.hive.jdbc.HiveDriver.connect(HiveDriver.java:105)
    at java.sql.DriverManager.getConnection(DriverManager.java:664)
    at java.sql.DriverManager.getConnection(DriverManager.java:247)
    at com.sz.mysql.SyncMysql.getHiveConnection(SyncMysql.java:128)
    at com.sz.mysql.SyncMysql.main(SyncMysql.java:72)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:904)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
java.sql.SQLException: Could not establish connection to jdbc:hive2://192.168.67.145:10000/zlgx_ods: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.hive.jdbc.HiveConnection.openSession(HiveConnection.java:586)
    at org.apache.hive.jdbc.HiveConnection.<init>(HiveConnection.java:194)
    at org.apache.hive.jdbc.HiveDriver.connect(HiveDriver.java:105)
    at java.sql.DriverManager.getConnection(DriverManager.java:664)
    at java.sql.DriverManager.getConnection(DriverManager.java:247)
    at com.sz.mysql.SyncMysql.getHiveConnection(SyncMysql.java:128)
    at com.sz.mysql.SyncMysql.main(SyncMysql.java:72)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:904)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:198)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:228)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:137)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: org.apache.thrift.TApplicationException: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=zlgx_ods})
    at org.apache.thrift.TApplicationException.read(TApplicationException.java:111)
    at org.apache.thrift.TServiceClient.receiveBase(TServiceClient.java:79)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.recv_OpenSession(TCLIService.java:156)
    at org.apache.hive.service.cli.thrift.TCLIService$Client.OpenSession(TCLIService.java:143)
    at org.apache

代码:


package com.sz.mysql;

import org.apache.spark.sql.*;

import java.sql.*;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

/**
 * @author nanlei
 * @date 2021年05月10日
 */
public class SyncMysql {


    public static void main(String[] args) throws ParseException {


        try {
            //日期 20210101
//            String date = args[0];
            String date = "20210728";

            System.setProperty("HADOOP_USER_NAME", "hdfs");
            SparkSession spark = SparkSession
                    .builder()
                    .config("mapreduce.fileoutputcommitter.marksuccessfuljobs", false)
                    .config("parquet.enable.summary-metadata", false)
                    .appName("SyncMysql")
                    .master("local[*]")
                    .getOrCreate();

            Connection conn = getMysqlConnection();
            Statement stat = conn.createStatement();
            ResultSet rs = stat.executeQuery("select * from sync_mysql_to_hive");
            while (rs.next()) {
                String src_path = rs.getString("src_path");
                String target_parh = rs.getString("target_parh");
                String table_name = rs.getString("table_name");
                String date_field = rs.getString("date_field");
                String date_format = rs.getString("date_format");
                String username = rs.getString("username");
                String password = rs.getString("password");
                System.out.println("参数列表:");
                System.out.println("src_path: " + src_path);
                System.out.println("target_parh: " + target_parh);
                System.out.println("table_name: " + table_name);
                System.out.println("date_field: " + date_field);
                System.out.println("date_format: " + date_format);
                System.out.println("username: " + username);
                System.out.println("password: " + password);

                String hdfsPath = (target_parh + "/" + date.substring(0, 4) + "/" + date.substring(4, 6) + "/" + date.substring(6, 8)) + "/";

                SimpleDateFormat srcFormat = new SimpleDateFormat("yyyyMMdd");
                Date d = srcFormat.parse(date);
                SimpleDateFormat targetFormat = new SimpleDateFormat(date_format);
                String targetDate = targetFormat.format(d);

                Dataset<Row> row = getMetaDataset(spark, src_path, table_name, username, password);
                Dataset<Row> queryRow = row.where(date_field + " like '%" + targetDate + "%'");

                String[] columnNames = queryRow.columns();
                Column[] columns = new Column[columnNames.length];
                for (int i = 0; i < columnNames.length; i++) {
                    columns[i] = queryRow.col(columnNames[i]).cast("string");
                }
                Dataset<Row> newRow = queryRow.select(columns);

                newRow.write().mode(SaveMode.Overwrite).parquet(hdfsPath);
                Class.forName("org.apache.hive.jdbc.HiveDriver");
                Connection hiveCon = DriverManager.getConnection("jdbc:hive2://192.168.67.145:10000/zlgx_ods", "hive", "hive");
                Statement hiveStat = hiveCon.createStatement();
                String template = "alter table zlgx_ods.%s add if not exists partition (year = '%s' ,month = '%s' , day ='%s' ) location  '%s'";
                String sql = String.format(template, table_name, date.substring(0, 4), date.substring(4, 6), date.substring(6, 8), hdfsPath);
                System.out.println("执行sql--->" + sql);
                hiveStat.execute(sql);
                System.out.println("关联hive完成");
                hiveStat.close();
                hiveCon.close();
            }
            rs.close();
            conn.close();
            spark.close();


        } catch (Exception e) {
            e.printStackTrace();
        }

    }


    public static Dataset<Row> getMetaDataset(SparkSession spark, String jdbcUrl, String tableName, String username, String password) {
        Dataset<Row> conosequence = null;
        try {
            conosequence = spark.read().format("jdbc").option("delimiter", ",")
                    .option("header", "true")
                    .option("url", jdbcUrl)
                    .option("dbtable", tableName)
                    .option("user", username)
                    .option("password", password)
                    .load();
        } catch (Exception e) {
            e.printStackTrace();
        }
        return conosequence;
    }

    public static Connection getMysqlConnection() {
        Connection con = null;
        try {
            Class.forName("com.mysql.cj.jdbc.Driver");  //注册数据库驱动
            String url = "jdbc:mysql://192.168.67.189:3306/etl_2020?useSSL=false&characterEncoding=utf-8&serverTimezone=UTC";  //定义连接数据库的url
            con = DriverManager.getConnection(url, "wangchen", "wc-jrgx");  //获取数据库连接
            System.out.println("数据库连接成功！");
        } catch (Exception e) {
            e.printStackTrace();
        }
        return con;  //返回一个连接
    }


}

maven配置:

    <dependencies>

        <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core -->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>2.3.1</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-sql_2.11</artifactId>
            <version>2.3.1</version>
        </dependency>


        <!-- https://mvnrepository.com/artifact/com.esotericsoftware/kryo -->
        <dependency>
            <groupId>com.esotericsoftware</groupId>
            <artifactId>kryo</artifactId>
            <version>4.0.2</version>
        </dependency>

        <!--mysql-->
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.25</version>
        </dependency>
        <!-- hive依赖 -->
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-jdbc</artifactId>
            <version>1.1.0</version>
        </dependency>
        <!-- 中文分词器 -->
        <dependency>
            <groupId>cn.bestwu</groupId>
            <artifactId>ik-analyzers</artifactId>
            <version>5.1.0</version>
        </dependency>
    </dependencies>

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-星云 2021-07-30 20:52
关注
可参考：https://blog.csdn.net/zt15732625878/article/details/85245731
看客户端的 hive-jdbc的version 和hive Server的version是否一致
如有帮助，望采纳

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
Hive引擎替换为Spark（Hive on Spark）
2020-05-18 22:44

Ethan130的博客 Hive引擎替换为Spark（Hive on Spark）1、背景2、Hive引擎选择3、三种引擎如何切换引擎？4、hive on spark配置集群模式5、hive on spark参数调优6、结束语 1、背景 Hive on Spark是由Cloudera发起，由Intel、MapR等...
Hive on Spark配置问题 hive spark
2022-12-08 11:36

回答 3 已采纳 hive-seit.xml文件里面必须要添加设置执行引擎为spark
hive on spark运行sql报错 hive spark 有问必答
2021-09-28 16:58

回答 2 已采纳该问题由hive与spark两者版本不兼容导致的，具体的解释，在官网是有说明的：Hive on Spark is only tested with a specific version of Spar
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
大数据开发面试知识点总结
2021-02-09 11:22

GoAI的博客本文详细介绍大数据hadoop生态圈各部分知识，包括不限于hdfs、yarn、mapreduce、hive、sqoop、kafka、flume、spark、flink等技术，总结内容适合大数据开发者学习，希望能够和大家多多交流。
spark通过jdbc读取hive的表报错，我是在zeppelin里运行的 hive spark
2017-06-06 08:21

回答 1 已采纳在目前Hive 1.2的JDBC版本里面，使用它会报错：`java.sql.SQLException: Method not supported at org.apache.hive.jdbc.Hiv
hive on spark 打开文件过多错误 hadoop hive spark
2022-05-19 19:51

回答 3 已采纳你用的beeline方式连接的吧 beeline连接是有限的当连接超出的时候就会出问题你尝试一下直接连接hivecli 应该会好一点
hive | o.a.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out flink hive spark
2021-12-15 08:56

回答 2 已采纳 [HIVE-22196] Socket timeouts happen when other drivers set DriverManager.loginTimeout - ASF JIRA程序中使
hadoop、hbase、hive、spark分布式系统架构原理
2018-05-15 11:22

腾讯数据架构师的博客机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统，hadoop用户分布式存储和map-reduce计算，spark用于分布式机器学习，hive是分布式数据库，hbase是分布式kv系统，看似互不相关的他们却都是基于相同的...
关于#大数据#的问题，如何解决？ hive java 大数据
2023-02-21 09:58

回答 2 已采纳你去看一下这个job的日志报的什么错误
大数据技术1：大数据发展简史
2023-12-05 18:04

Java架构何哥的博客并且数据产生的速度随着采集与处理技术的更新仍在加快。数据量从兆字节(MB)、吉字节 (GB) 的级别到现在的太字节 (TB)、柏字节(PB) 级别，数据量的变化促使数据管理系统(DBMS) 和数据仓库(DataWarehouse,DW)系统也...
hive参数调优
2022-11-03 10:38

caiyefly的博客 hive指定spark为数据执行引擎，hive参数调优
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 3月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月30日

悬赏问题

¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥15 键盘指令混乱情况下的启动盘系统重装
¥40 复杂的限制性的商函数处理

spark与hive版本问题? 本机正常运行,服务器上报错.

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新