java 实现 sparksql 时，mysql数据库查询结果只有表头没有数据

这两天尝试用java实现sparksql连接mysql数据库，经过调试可以成功连接到数据库，但奇怪的是只能够查询出表头和表结构却看不到表里面数据
代码如下
import java.util.Hashtable;
import java.util.Properties;
import javax.swing.JFrame;
import org.apache.avro.hadoop.io.AvroKeyValue.Iterator;
import org.apache.hadoop.hdfs.protocolPB.DatanodeProtocolServerSideTranslatorPB;
import org.apache.hadoop.hive.ql.exec.vector.expressions.IsNull;
import org.apache.log4j.Logger;

import org.apache.spark.SparkConf;
import org.apache.spark.SparkContext;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.rdd.RDD;
import org.apache.spark.sql.DataFrameReader;
import org.apache.spark.sql.DataFrameWriter;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SQLContext;

import org.apache.spark.sql.SaveMode;
import org.apache.spark.sql.SparkSession;
import org.apache.spark.sql.SparkSession.Builder;
import org.apache.spark.sql.jdbc.JdbcDialect;
import org.datanucleus.store.rdbms.identifier.IdentifierFactory;
import antlr.collections.List;
import scala.Enumeration.Val;

public class Demo_Mysql3 {

private static Logger logger = Logger.getLogger(Demo_Mysql3.class);

public static void main(String[] args) {

SparkConf sparkConf = new SparkConf();
sparkConf.setAppName("Demo_Mysql3");

sparkConf.setMaster("local[5]");

sparkConf.setSparkHome("F:\DownLoad\spark\spark-2.0.0-bin-hadoop2.7");
sparkConf.set("spark.sql.warehouse.dir","F:\DownLoad\spark\spark-2.0.0-bin-hadoop2.7");
SparkContext sc0=null;
try {

sc0=new SparkContext(sparkConf);
SparkSession sparkSession=new SparkSession(sc0);
SQLContext sqlContext = new SQLContext(sparkSession);

// 一个条件表示一个分区

String[] predicates = new String[] {

"1=1 order by id limit 400000,50000",

"1=1 order by id limit 450000,50000",

"1=1 order by id limit 500000,50000",

"1=1 order by id limit 550000,50000",

"1=1 order by id limit 600000,50000" };

String url = "jdbc:mysql://localhost:3306/clone";

String table = "image";

Properties connectionProperties = new Properties();

connectionProperties.setProperty("dbtable", table);// 设置表

connectionProperties.setProperty("user", "root");// 设置用户名

connectionProperties.setProperty("password", "root");// 设置密码

// 读取数据

DataFrameReader jread = sqlContext.read();
//Dataset jdbcDs=jread.jdbc(url, table, predicates, connectionProperties);
sqlContext.read().jdbc(url, table, predicates, connectionProperties).select("*").show();
} catch (Exception e) {

logger.error("|main|exception error", e);

} finally {

if (sc0 != null) {

sc0.stop();

}

}

}

}
控制台输出如下：

展开全部

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
绳绳兮不可名 2017-07-21 23:35
关注
全部输出如下;
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
17/07/22 10:39:04 INFO SparkContext: Running Spark version 2.0.0
17/07/22 10:39:04 INFO SecurityManager: Changing view acls to: Mr.Zhang
17/07/22 10:39:04 INFO SecurityManager: Changing modify acls to: Mr.Zhang
17/07/22 10:39:04 INFO SecurityManager: Changing view acls groups to:
17/07/22 10:39:04 INFO SecurityManager: Changing modify acls groups to:
17/07/22 10:39:04 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(Mr.Zhang); groups with view permissions: Set(); users with modify permissions: Set(Mr.Zhang); groups with modify permissions: Set()
17/07/22 10:39:05 INFO Utils: Successfully started service 'sparkDriver' on port 4469.
17/07/22 10:39:05 INFO SparkEnv: Registering MapOutputTracker
17/07/22 10:39:05 INFO SparkEnv: Registering BlockManagerMaster
17/07/22 10:39:05 INFO DiskBlockManager: Created local directory at C:\Users\Mr.Zhang\AppData\Local\Temp\blockmgr-c055d142-9742-4d45-bc98-f7c337c2beed
17/07/22 10:39:05 INFO MemoryStore: MemoryStore started with capacity 1990.8 MB
17/07/22 10:39:05 INFO SparkEnv: Registering OutputCommitCoordinator
17/07/22 10:39:05 INFO Utils: Successfully started service 'SparkUI' on port 4040.
17/07/22 10:39:05 INFO SparkUI: Bound SparkUI to 0.0.0.0, and started at http://169.254.236.65:4040
17/07/22 10:39:05 INFO Executor: Starting executor ID driver on host localhost
17/07/22 10:39:06 INFO Utils: Successfully started service 'org.apache.spark.network.netty.NettyBlockTransferService' on port 4498.
17/07/22 10:39:06 INFO NettyBlockTransferService: Server created on 169.254.236.65:4498
17/07/22 10:39:06 INFO BlockManagerMaster: Registering BlockManager BlockManagerId(driver, 169.254.236.65, 4498)
17/07/22 10:39:06 INFO BlockManagerMasterEndpoint: Registering block manager 169.254.236.65:4498 with 1990.8 MB RAM, BlockManagerId(driver, 169.254.236.65, 4498)
17/07/22 10:39:06 INFO BlockManagerMaster: Registered BlockManager BlockManagerId(driver, 169.254.236.65, 4498)
17/07/22 10:39:06 INFO SharedState: Warehouse path is 'F:\DownLoad\spark\spark-2.0.0-bin-hadoop2.7'.
17/07/22 10:39:08 INFO CodeGenerator: Code generated in 173.873451 ms
17/07/22 10:39:08 INFO SparkContext: Starting job: show at Demo_Mysql3.java:71
17/07/22 10:39:08 INFO DAGScheduler: Got job 0 (show at Demo_Mysql3.java:71) with 1 output partitions
17/07/22 10:39:08 INFO DAGScheduler: Final stage: ResultStage 0 (show at Demo_Mysql3.java:71)
17/07/22 10:39:08 INFO DAGScheduler: Parents of final stage: List()
17/07/22 10:39:08 INFO DAGScheduler: Missing parents: List()
17/07/22 10:39:08 INFO DAGScheduler: Submitting ResultStage 0 (MapPartitionsRDD[2] at show at Demo_Mysql3.java:71), which has no missing parents
17/07/22 10:39:08 INFO MemoryStore: Block broadcast_0 stored as values in memory (estimated size 9.9 KB, free 1990.8 MB)
17/07/22 10:39:08 INFO MemoryStore: Block broadcast_0_piece0 stored as bytes in memory (estimated size 4.6 KB, free 1990.8 MB)
17/07/22 10:39:08 INFO BlockManagerInfo: Added broadcast_0_piece0 in memory on 169.254.236.65:4498 (size: 4.6 KB, free: 1990.8 MB)
17/07/22 10:39:08 INFO SparkContext: Created broadcast 0 from broadcast at DAGScheduler.scala:1012
17/07/22 10:39:08 INFO DAGScheduler: Submitting 1 missing tasks from ResultStage 0 (MapPartitionsRDD[2] at show at Demo_Mysql3.java:71)
17/07/22 10:39:08 INFO TaskSchedulerImpl: Adding task set 0.0 with 1 tasks
17/07/22 10:39:08 INFO TaskSetManager: Starting task 0.0 in stage 0.0 (TID 0, localhost, partition 0, PROCESS_LOCAL, 5149 bytes)
17/07/22 10:39:08 INFO Executor: Running task 0.0 in stage 0.0 (TID 0)
17/07/22 10:39:08 INFO JDBCRDD: closed connection
17/07/22 10:39:08 INFO Executor: Finished task 0.0 in stage 0.0 (TID 0). 1091 bytes result sent to driver
17/07/22 10:39:08 INFO TaskSetManager: Finished task 0.0 in stage 0.0 (TID 0) in 109 ms on localhost (1/1)
17/07/22 10:39:08 INFO TaskSchedulerImpl: Removed TaskSet 0.0, whose tasks have all completed, from pool
17/07/22 10:39:08 INFO DAGScheduler: ResultStage 0 (show at Demo_Mysql3.java:71) finished in 0.109 s
17/07/22 10:39:08 INFO DAGScheduler: Job 0 finished: show at Demo_Mysql3.java:71, took 0.320450 s
17/07/22 10:39:09 INFO SparkContext: Starting job: show at Demo_Mysql3.java:71
17/07/22 10:39:09 INFO DAGScheduler: Got job 1 (show at Demo_Mysql3.java:71) with 4 output partitions
17/07/22 10:39:09 INFO DAGScheduler: Final stage: ResultStage 1 (show at Demo_Mysql3.java:71)
17/07/22 10:39:09 INFO DAGScheduler: Parents of final stage: List()
17/07/22 10:39:09 INFO DAGScheduler: Missing parents: List()
17/07/22 10:39:09 INFO DAGScheduler: Submitting ResultStage 1 (MapPartitionsRDD[2] at show at Demo_Mysql3.java:71), which has no missing parents
17/07/22 10:39:09 INFO MemoryStore: Block broadcast_1 stored as values in memory (estimated size 9.9 KB, free 1990.8 MB)
17/07/22 10:39:09 INFO MemoryStore: Block broadcast_1_piece0 stored as bytes in memory (estimated size 4.6 KB, free 1990.8 MB)
17/07/22 10:39:09 INFO BlockManagerInfo: Added broadcast_1_piece0 in memory on 169.254.236.65:4498 (size: 4.6 KB, free: 1990.8 MB)
17/07/22 10:39:09 INFO SparkContext: Created broadcast 1 from broadcast at DAGScheduler.scala:1012
17/07/22 10:39:09 INFO DAGScheduler: Submitting 4 missing tasks from ResultStage 1 (MapPartitionsRDD[2] at show at Demo_Mysql3.java:71)
17/07/22 10:39:09 INFO TaskSchedulerImpl: Adding task set 1.0 with 4 tasks
17/07/22 10:39:09 INFO TaskSetManager: Starting task 0.0 in stage 1.0 (TID 1, localhost, partition 1, PROCESS_LOCAL, 5149 bytes)
17/07/22 10:39:09 INFO TaskSetManager: Starting task 1.0 in stage 1.0 (TID 2, localhost, partition 2, PROCESS_LOCAL, 5149 bytes)
17/07/22 10:39:09 INFO TaskSetManager: Starting task 2.0 in stage 1.0 (TID 3, localhost, partition 3, PROCESS_LOCAL, 5149 bytes)
17/07/22 10:39:09 INFO TaskSetManager: Starting task 3.0 in stage 1.0 (TID 4, localhost, partition 4, PROCESS_LOCAL, 5149 bytes)
17/07/22 10:39:09 INFO Executor: Running task 0.0 in stage 1.0 (TID 1)
17/07/22 10:39:09 INFO Executor: Running task 1.0 in stage 1.0 (TID 2)
17/07/22 10:39:09 INFO Executor: Running task 2.0 in stage 1.0 (TID 3)
17/07/22 10:39:09 INFO Executor: Running task 3.0 in stage 1.0 (TID 4)
17/07/22 10:39:09 INFO JDBCRDD: closed connection
17/07/22 10:39:09 INFO Executor: Finished task 0.0 in stage 1.0 (TID 1). 1091 bytes result sent to driver
17/07/22 10:39:09 INFO JDBCRDD: closed connection
17/07/22 10:39:09 INFO TaskSetManager: Finished task 0.0 in stage 1.0 (TID 1) in 23 ms on localhost (1/4)
17/07/22 10:39:09 INFO Executor: Finished task 1.0 in stage 1.0 (TID 2). 1091 bytes result sent to driver
17/07/22 10:39:09 INFO JDBCRDD: closed connection
17/07/22 10:39:09 INFO Executor: Finished task 2.0 in stage 1.0 (TID 3). 1091 bytes result sent to driver
17/07/22 10:39:09 INFO JDBCRDD: closed connection
17/07/22 10:39:09 INFO TaskSetManager: Finished task 1.0 in stage 1.0 (TID 2) in 23 ms on localhost (2/4)
17/07/22 10:39:09 INFO TaskSetManager: Finished task 2.0 in stage 1.0 (TID 3) in 19 ms on localhost (3/4)
17/07/22 10:39:09 INFO Executor: Finished task 3.0 in stage 1.0 (TID 4). 1091 bytes result sent to driver
17/07/22 10:39:09 INFO TaskSetManager: Finished task 3.0 in stage 1.0 (TID 4) in 35 ms on localhost (4/4)
17/07/22 10:39:09 INFO TaskSchedulerImpl: Removed TaskSet 1.0, whose tasks have all completed, from pool
17/07/22 10:39:09 INFO DAGScheduler: ResultStage 1 (show at Demo_Mysql3.java:71) finished in 0.039 s
17/07/22 10:39:09 INFO DAGScheduler: Job 1 finished: show at Demo_Mysql3.java:71, took 0.045598 s
+------+-----+----+---------+----+---+---------+---+
|status|count|type|threshold|wkey|url|imagename| id|
+------+-----+----+---------+----+---+---------+---+
+------+-----+----+---------+----+---+---------+---+

17/07/22 10:39:09 INFO SparkUI: Stopped Spark web UI at http://169.254.236.65:4040
17/07/22 10:39:09 INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!
17/07/22 10:39:09 INFO MemoryStore: MemoryStore cleared
17/07/22 10:39:09 INFO BlockManager: BlockManager stopped
17/07/22 10:39:09 INFO BlockManagerMaster: BlockManagerMaster stopped
17/07/22 10:39:09 INFO OutputCommitCoordinator$OutputCommitCoordinatorEndpoint: OutputCommitCoordinator stopped!
17/07/22 10:39:09 INFO SparkContext: Successfully stopped SparkContext
17/07/22 10:39:09 INFO ShutdownHookManager: Shutdown hook called
17/07/22 10:39:09 INFO ShutdownHookManager: Deleting directory C:\Users\Mr.Zhang\AppData\Local\Temp\spark-37d86494-fe2c-44a6-8bb2-989db283dc8b

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

java 实现 sparksql 时，使用分区，mysql数据库查询结果只有表头没有数据 java mysql spark
2017-07-23 01:12

回答 2 已采纳以解决，是分区太大，掩盖了之前的任务
Java ,mybatis 往 mysql数据库添加信息，没有出现新数据呢 java mysql 数据库
2022-10-26 03:24

回答 2 已采纳猜测：事务没有提交执行完插入没有显式提交，或者默认自动提交，在自动提交的情况下应结束当前方法才会执行提交内容，该方法内容是个死循环（while(true)）没结束故而事务没有提交，可以结束该方法
mysql数据同步到大数据后通过查询大数据实现报表的实时展示 big data java mysql 有问必答
2021-09-18 02:38

回答 4 已采纳你好像描述的有些问题吧？为什么查询大数据展示？你口中的大数据指定到底是什么？如果你是学习大数据（hadoop相关），使用java语言在做数仓项目，那么你可以参考一下这张图查询数据一般从数据库里面查
大数据技术之SparkSQL
2023-09-07 15:27

一束玫瑰作物'的博客 Spark SQL是基于Apache Spark的大数据处理引擎，结合SQL查询语言和分布式计算，提供高性能的数据分析。支持DataFrame/DataSet、自定义函数、多数据源、优化器等功能，适用于批处理和实时数据处理，与外部存储和数据...
如何用java实现对mysql数据库中多用户对一条数据的互斥访问 java java-ee mysql tomcat
2020-02-23 09:45

回答 1 已采纳如果这条数据不会有变动的话，其实不需要担心共享读会出现什么问题。如果这条数据在共享读的时候会有变动可能性的话，最常用的方式就是在java层面加上一把锁，如果是单机版的情况下加入synchroni
mysql查询近一年数据有的月没有数据但是还是需要展示商品名 java mysql 数据库有问必答
2022-03-02 07:18

回答 4 已采纳方案一,你这个数据库里应该还有个完整的商品信息表吧,你把那个商品信息表和你做的这个月份数据进行笛卡尔积join,即不使用任何条件,即可得到任意商品和任意月份的组合数据,这个时候再用这个数据去left
base64格式图片，mysql数据库应该用什么数据类型？ java layui mysql
2023-03-16 06:24

回答 3 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ如果你将图片转换成base64后存储在MySQL数据库中，可以使用 LONGTEXT 类型的字段来存储数据。BLOB 类型可以存储二进制数据，但是可能会导致性能问题。在前
第六课 大数据技术之Spark-SparkSql
2022-10-17 16:16

道教儒佛电磁波的博客 SparkSql
MySQL 数据库疑问查询学生平均分大于60的结果 mysql sql 数据库
2022-04-19 12:57

回答 1 已采纳第一条sql中的子查询，查出来的是12个不同的值，而不是行记录，然后再从sc表里去找满足这12个值的行记录，可以找到有37行（等同于 in ('11111','2222','3333','4444',
怎样能把sparksql的查询结果导到本地和MySQL kylin spark 大数据有问必答
2023-01-20 08:47

回答 1 已采纳将 Spark SQL 查询结果导出到本地可以使用 DataFrame.write.format("csv").save("output") 方法，但是您遇到的错误是由于 Hadoop 集群连接问题导
java mybaties 在数据库插入数据的时候，如何使用mysql的默认值 java
2022-04-28 12:49

回答 4 已采纳那就给model实体类设置值。在model里面给status设置值＝1
03_大数据技术之SparkSql（2.0）
2020-11-07 07:56

okbin1991的博客与基本的Spark RDD API不同，Spark SQL的抽象数据类型为Spark提供了关于数据结构和正在执行的计算的更多信息。在内部，Spark SQL使用这些额外的信息去做一些额外的优化，有多种方式与Spark SQL进行...
在sql中多大的数据才算是大数据？ java mysql 数据库
2022-03-31 09:24

回答 4 已采纳其实没有实际的标准明确定义多少数据量算大数据，不过阿里开发手册中建议，表数据超过500万条时，建议考虑分表，以防影响查询效率，不过我们公司也有单表超过几千万条的数据，效率确实不高，所以理论上百万级别以
解决hive表新增的字段查询为空null问题
2022-02-16 13:31

爱开发V的博客 Hive分区表新增字段，查询时数据为NULL的解决方案由于业务拓展，需要往hive分区表新增新的字段，hive版本为2点多。于是利用alter table table_name add c...
大数据之Spark（5）- SparkSql
2022-01-29 02:15

jackyan163的博客 Spark SQL是Spark用来处理结构化数据的一个模块，它提供了2个编程抽象：DataFrame和DataSet，并且作为分布式SQL查询引擎的作用。我们已经学习了Hive，它是将Hive SQL转换成MapReduce然后提交到集群上执行，大大简化...
没有解决我的问题, 去提问

悬赏问题

¥15 spaceclaim脚本
¥15 MC9S12XS128单片机实验
¥15 失败的github程序安装
¥15 WSL上下载的joern在windows怎么用？
¥15 jetson nano4GB
¥15 电脑回复出厂设置，重装过程报错提示，求解决方案Windows 无法分析或处理无人参与应答文件 [C:\WINDOWS\Panther\unattend.xml，如何解决？
¥15 进入lighttools中的UDOP编辑器的方法
¥15 求Gen6d训练数据集
¥20 liunx中winscp中可以登入ftp,但是不能登入sftp,如何解决
¥15 lighttools的光学属性自定义的用法流程

java 实现 sparksql 时，mysql数据库查询结果只有表头没有数据

4条回答 默认 最新

悬赏问题

4条回答默认最新