linux pyspark连接mysql出错

下载好了mysql的驱动jar包，但是在连接mysql的时候出现错误pyspark does not support any appliance options
请问这是什么原因

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-04-03 02:05

关注

不知道你这个问题是否已经解决, 如果还没有解决的话:

帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/688018
这篇博客也不错, 你可以看下pyspark出现错误

除此之外, 这篇博客: linux 通过JDBC连接数据库，使用Spark读写MySql数据库的数据（2021-10-3）中的 三、启动pyspark，连接数据库，读写数据 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

1.启动pyspark，附加如下参数。
因为启动pyspark时，必须指定mysql连接驱动jar包（如果你前面已经采用下面方式启动了pyspark，就不需要重复启动了）。\表示换行。因为之前设置了SPARK_PATH环境变量，可以在全局输入pyspark启动，不需要进入bin目录。

pyspark \
--jars /usr/local/spark/jars/mysql-connector-java-8.0.26/mysql-connector-java-8.0.26.jar \
--driver-class-path  /usr/local/spark/jars/mysql-connector-java-8.0.26/mysql-connector-java-8.0.26.jar

过程：
在这里插入图片描述
2.通过spark.read.format(“jdbc”).option().option()…操作通过JDBC连接MySql数据库时。

jdbcDF = spark.read.format("jdbc").option("url", "jdbc:mysql://localhost:3306/spark").option("driver","com.mysql.cj.jdbc.Driver").option("dbtable", "student").option("user", "root").option("password", "123456").load()
jdbcDF.show()

结果如图：
在这里插入图片描述
在pyspark中执行如下命令对数据进行读写：

from pyspark.sql.types import Row
from pyspark.sql.types import StructType
from pyspark.sql.types import StructField
from pyspark.sql.types import StringType
from pyspark.sql.types import IntegerType
studentRDD = spark.sparkContext.parallelize(["3 Rongcheng M 26","4 Guanhua M 27"]).map(lambda line : line.split(" "))
//下面要设置模式信息
schema = StructType([StructField("name", StringType(), True),StructField("gender", StringType(), True),StructField("age",IntegerType(), True)])
rowRDD = studentRDD.map(lambda p : Row(p[1].strip(), p[2].strip(),int(p[3])))
//建立起Row对象和模式之间的对应关系，也就是把数据和模式对应起来
studentDF = spark.createDataFrame(rowRDD, schema)
prop = {}
prop['user'] = 'root'
prop['password'] = '123456'
prop['driver'] = "com.mysql.cj.jdbc.Driver"
studentDF.write.jdbc("jdbc:mysql://localhost:3306/spark",'student','append', prop)

其中参数：

参数名称	含义
url	数据库的连接地址，如：jdbc:mysql://localhost:3306/spark（最后为数据库名）
Driver	数据库的驱动程序，如：com.mysql.cj.jdbc.Driver
dbtable	需要访问的表名
user	数据库用户名
password	数据库用户密码

过程：
在这里插入图片描述

在mysql中查看：
在这里插入图片描述
四、参考
1、驱动包下载和安装

Spark2.1.0入门：通过JDBC连接数据库(DataFrame)(Python版)
2、数据库连接
centos7下载spark连接mysql数据库提取数据(pyspark,Scala,python独立执行)
3、java、驱动包版本和mysql对应关系
mysql-connector-java与mysql版本的对应关系

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

报告相同问题？

关注问题

linux下不想安装mysql，要远程连接mysql这么办 linux mysql
2017-08-14 03:12

回答 4 已采纳装个工具就行了，比如phpmyadmin
linux 交叉编译 mysql 出错 c语言 github linux mysql ubuntu
2020-12-10 10:53

回答 2 已采纳 yum install -y gcc gcc-c++ make tar openssl openssl-devel cmake ncurses ncurses-devel libaio 这些依赖包都
Ubuntu java连接Mysql 失败 java mysql 大数据
2022-07-09 11:38

回答 3 已采纳 dbUrl 不要以&结尾，另外，试试在dbUrl中加上 &useSSL=false，禁用ssl
大数据集群（PySpark）+MySQL+PyEcharts+Flask：购物篮数据分析与挖掘
2024-07-19 22:13

侧耳倾听童话的博客密码：123456 python Python-3.9.0.tgz 3.9.0版本的Python MySQL Connector mysql-connector-java-5.1.32-bin.jar Spark 连接MySQL的驱动 IntelliJ IDEA Ultimate 2020.3 编程工具IDEA 大数据集群运行时，Spark...
连接mysql数据库，密码错误也能访问 java mysql 数据库
2022-09-25 11:22

回答 3 已采纳您好，您应该是设置了mysql允许不用密码验证就能登录吧。检查一下的配置：在mysql的配置my.ini中，打开文件，是否将skip-grant-tables = true如果是设置成了true，改为
navicat 使用ssh连接mysql 错误 mysql 数据库
2022-07-26 10:29

回答 1 已采纳 http://t.zoukankan.com/gisalameda-p-14522541.html
Linux下mysql重启失败 linux mysql 有问必答
2022-04-12 16:46

回答 5 已采纳命令错了。使用 service 启动：service mysqld restart
Python大数据之PySpark(三)使用Python语言开发Spark程序代码
2023-09-29 00:00

AIMaynor的博客文章目录使用Python语言开发Spark程序代码总结后记使用Python语言开发Spark程序代码 Spark Standalone的PySpark的搭建----bin/pyspark --master spark://node1:7077 Spark StandaloneHA的搭建—Master的单点故障...
Linux MySQL数据库备份 Linux MySQL数据库备份 linux mysql 数据库
2021-10-25 20:20

回答 1 已采纳 mysqldump -u username -ppass --singel-transactions > /opt/base.sql
linux系统rpm方式安装的mysql启动失败 linux mysql 数据库
2022-06-30 10:40

回答 3 已采纳安装时已经明确表示缺失libaio，需要使用yum -y install libaio在安装完成后，需要彻底卸载MySQL之后重新安装即可。可以参考我的博客： MySQL
linux怎么也连接不到windows主机的mysql。 linux mysql ubuntu
2021-11-11 10:50

回答 1 已采纳 wireshark抓包看
PySpark 连接Hive
2020-05-14 14:34

沧海泪箫的博客 D:\Anaconda3\Lib\site-packages更换为命令pip show pyspark查看到的地址（Location）再将mysql连接驱动例如mysql-connector-java-5.1.38-bin.jar放入D:\Anaconda3\Lib\site-packages\pyspark\jars中。为了加速pip...
mysql连接出错，不知道是什么原因 java mysql sql
2023-02-12 11:36

回答 4 已采纳我看你代码是没问题的，主要是mysql版本跟驱动版本的问题。如果是mysql服务器是8.0以上版本，建议你用 driver=com.mysql.cj.jdbc.Driver url=jdbc:my
如何学习Linux：糙快猛的大数据之路（只讲大数据开发用到的）
2024-07-22 20:00

数据小羊的博客想要快速掌握Linux和大数据技能？本文介绍"糙快猛"学习法，助你从入门到精通！涵盖Linux基础、Shell脚本、系统优化到Hadoop、Spark等大数据技术。通过实际案例和高级故障排除指南，让你迅速应对工作挑战。还有性能...
hadoop集群搭建、spark集群搭建、pyspark搭建（linux+window）
2023-10-28 14:31

Lfx_come on的博客 linux和window上安装pyspark库。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月2日

悬赏问题

¥15 C#中的编译平台的区别影响
¥15 软件供应链安全是跟可靠性有关还是跟安全性有关？
¥15 电脑蓝屏logfilessrtsrttrail问题
¥20 关于wordpress建站遇到的问题！(语言-php)（相关搜索：云服务器）
¥15 【求职】怎么找到一个周围人素质都很高不会欺负他人，并且未来月薪能够达到一万以上（技术岗）的工作？希望可以收到写有具体，可靠，已经实践过了的路径的回答？
¥15 Java+vue部署版本反编译
¥100 对反编译和ai熟悉的开发者。
¥15 带序列特征的多输出预测模型
¥15 Python 如何安装 distutils模块
¥15 关于#网络#的问题：网络是从楼上引一根网线下来，接了2台傻瓜交换机，也更换了ip还是不行

linux pyspark连接mysql出错

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新