pycharm 执行有关spark代码出现错误

版本情况：
win10
spark-2.3.0-bin-hadoop2.6
python3.5
jdk1.8.0_161
同样的代码在Jupyter 完全可以执行
执行代码如下

        try:
            sc.stop()
        except:
            pass
        from pyspark import SparkContext
        sc = SparkContext()
        # sc.master
        rdd = sc.textFile("rating2.csv")
        ratings = rdd.map(lambda line: line.split(";"))
        ratingsRDD = ratings.map(lambda x: (x[0], x[1], x[2]))
        ratings.persist()
        # #训练模型
        from pyspark.mllib.recommendation import ALS
        model = ALS.train(ratings, 5, 5, 0.01)
        # # #基于book推荐
        user_com = model.recommendUsers(int(id_book), 6)

pycharm 报错：

19/03/01 08:50:45 ERROR SparkUncaughtExceptionHandler: Uncaught exception in thread Thread[main,5,main]
java.util.NoSuchElementException: key not found: _PYSPARK_DRIVER_CALLBACK_HOST
    at scala.collection.MapLike$class.default(MapLike.scala:228)
    at scala.collection.AbstractMap.default(Map.scala:59)
    at scala.collection.MapLike$class.apply(MapLike.scala:141)
    at scala.collection.AbstractMap.apply(Map.scala:59)
    at org.apache.spark.api.python.PythonGatewayServer$$anonfun$main$1.apply$mcV$sp(PythonGatewayServer.scala:50)
    at org.apache.spark.util.Utils$.tryOrExit(Utils.scala:1302)
    at org.apache.spark.api.python.PythonGatewayServer$.main(PythonGatewayServer.scala:37)
    at org.apache.spark.api.python.PythonGatewayServer.main(PythonGatewayServer.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.spark.deploy.JavaMainApplication.start(SparkApplication.scala:52)
    at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:879)
    at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:197)
    at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:227)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:136)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

Process finished with exit code -1073740791 (0xC0000409)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
proplume 2019-03-10 23:46
关注
找到spark安装环境下的python中lib包例如我的是 F:\spark\spark-2.3.0-bin-hadoop2.6\python\lib

将两个压缩文件解压复制放到你的pycharm中python环境Lib\site-packages中

（打开pycharm-（左上角）file—settings–Project Interpreter–可查看你的python环境）

例如我的是 C:\Users\boos\PycharmProjects\untitled\venv\Lib\site-packages

pycharm中可成功运行spark

说明：如果你通过其他方式Lib\site-packages中已经有了pyspark、py4j包，最好移除并通过此方法将两个文件包粘贴到site-packages下

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pycharm 执行有关spark代码出现错误 java python scala
2019-03-01 09:09

回答 1 已采纳 ## 找到spark安装环境下的python中lib包例如我的是 F:\spark\spark-2.3.0-bin-hadoop2.6\python\lib ![图片说明](https://im
pycharm保存的代码怎么在Python运行 python
2021-10-22 20:11

回答 1 已采纳 Cd到文件路径运行命令python 该文件.py
pycharm运行requests库时出现错误 pycharm python 有问必答
2022-02-08 17:23

回答 3 已采纳可以远程看看看吗
在Windows下使用Pycharm运行Spark代码
2022-03-07 14:34

SpecialRiot的博客在Windows下使用Pycharm运行Spark代码
用PyCharm进行QT编程出现路径错误 pycharm python qt 有问必答
2022-06-12 17:48

回答 2 已采纳出错是说找不到 'E:/桌面文件/main.py' 文件,检查main.py是在E:/桌面文件/ 目录中吗.实际的文件名是 main.py 吗? 是不是写错了另外文件路径最好别用中文, "桌面文件
pycharm执行python manage.py migrate失败 django pycharm python
2023-03-05 17:00

回答 2 已采纳你的第一个截图，显然已经设置run manage.py Task，可以省去python manage.py，直接加命令执行就可以了有帮助的话，请点采纳~
pycharm社区版连接mysql出现错误 mysql pycharm python
2022-11-28 20:51

回答 2 已采纳有没有安装对应驱动
Pycharm连接远端Python环境操作Spark
2023-06-24 18:48

时下握今的博客远程连接方案, 允许程序员连接远端测试环境, 确保环境的统一, 避免各种环境问题的发生,而且由于是连接的远程环境, 所有在Pycharm编写的代码都会自动上传到远端服务器, 在执行代码的时候, 相当于是直接在远端环境上...
mac系统下pycharm运行显示错误代码137 python 有问必答
2022-03-24 11:44

回答 2 已采纳 code 137是内存不足的报错
Pycharm 编写Python代码运行问题 pycharm python
2022-08-12 16:17

回答 1 已采纳首先，Pycharm是个非常强大的工具，它是以工程为单位来管理你的文件的你可以写一个主py文件（入口文件），然后用它来调用其它100个文件来执行一个复杂的任务那总不能你编哪个文件就以哪个文件作为入口吧
pycharm中python测试代码的报错 python
2021-08-19 21:21

回答 2 已采纳大的错误应该没有，主要是格式并不规范，右键全选复制然后粘贴，或者依次点击划线语句的灯泡💡来修复格式。
Windows Pycharm 下运行Spark 错误纪录
2022-10-29 18:28

leader_ww的博客 Windows Pycharm 下运行Spark 错误纪录
pycharm出现此代码无法访问怎么办？ python 有问必答
2021-05-17 14:04

回答 3 已采纳你的缩进有问题吧！ def fib(n): if n==1: return 1 elif n==2: return 1 else:
记搭建pycharm远程连接spark的艰难过程
2022-10-15 13:42

天亮说晚安ii的博客 py4j.protocol.Py4JError: org.apache.spark.api.python.PythonUtils.isEncryptionEnabled does not exist in the JVM，ModuleNotFoundError: No module named '_ctypes'
PyCharm远程连接Spark
2021-07-22 17:33

ruth13156402807的博客 PyCharm远程连接Spark 使用PyCharm连接远程服务器，总结一下完善的步骤。连接前一定要保证集群已经可以运行pyspark程序 1、添加SFTP连接找到菜单Tool ->Deployment -> Configuration设置sftp 点击左上角的+...
没有解决我的问题, 去提问

悬赏问题

¥15 slam rangenet++配置
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制
¥20 usb设备兼容性问题
¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊

pycharm 执行有关spark代码出现错误

1条回答 默认 最新

找到spark安装环境 下的python中lib包 例如我的是 F:\spark\spark-2.3.0-bin-hadoop2.6\python\lib

将两个压缩文件解压 复制 放到你的pycharm中python环境Lib\site-packages中

例如我的是 C:\Users\boos\PycharmProjects\untitled\venv\Lib\site-packages

pycharm中可成功运行spark

说明：如果你通过其他方式Lib\site-packages中已经有了pyspark、py4j包，最好移除并通过此方法将两个文件包粘贴到site-packages下

悬赏问题

1条回答默认最新

找到spark安装环境下的python中lib包例如我的是 F:\spark\spark-2.3.0-bin-hadoop2.6\python\lib

将两个压缩文件解压复制放到你的pycharm中python环境Lib\site-packages中