pyspark报错 java.net.SocketException: Connection reset by peer: socket write error

File "D:\ProgramData\spark-3.1.2-bin-hadoop3.2\python\pyspark\sql\dataframe.py", line 484, in show
print(self._jdf.showString(n, 20, vertical))

File "D:\ProgramData\spark-3.1.2-bin-hadoop3.2\python\lib\py4j-0.10.9-src.zip\py4j\java_gateway.py", line 1304, in __call__
return_value = get_return_value(

File "D:\ProgramData\spark-3.1.2-bin-hadoop3.2\python\pyspark\sql\utils.py", line 111, in deco
return f(*a, **kw)

File "D:\ProgramData\spark-3.1.2-bin-hadoop3.2\python\lib\py4j-0.10.9-src.zip\py4j\protocol.py", line 326, in get_return_value
raise Py4JJavaError(

Py4JJavaError: An error occurred while calling o6128.showString.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 128.0 failed 1 times, most recent failure: Lost task 0.0 in stage 128.0 (TID 6757) (DESKTOP-RB5UA6R executor driver): java.net.SocketException: Connection reset by peer: socket write error
   at java.net.SocketOutputStream.socketWrite0(Native Method)
   at java.net.SocketOutputStream.socketWrite(SocketOutputStream.java:111)
   at java.net.SocketOutputStream.write(SocketOutputStream.java:155)
   at java.io.BufferedOutputStream.flushBuffer(BufferedOutputStream.java:82)
   at java.io.BufferedOutputStream.write(BufferedOutputStream.java:126)
   at java.io.DataOutputStream.write(DataOutputStream.java:107)
   at java.io.FilterOutputStream.write(FilterOutputStream.java:97)
   at org.apache.spark.api.python.PythonRDD$.write$1(PythonRDD.scala:295)
   at org.apache.spark.api.python.PythonRDD$.$anonfun$writeIteratorToStream$1(PythonRDD.scala:307)
   at org.apache.spark.api.python.PythonRDD$.$anonfun$writeIteratorToStream$1$adapted(PythonRDD.scala:307)
   at scala.collection.Iterator.foreach(Iterator.scala:941)
   at scala.collection.Iterator.foreach$(Iterator.scala:941)
   at scala.collection.AbstractIterator.foreach(Iterator.scala:1429)
   at org.apache.spark.api.python.PythonRDD$.writeIteratorToStream(PythonRDD.scala:307)
   at org.apache.spark.sql.execution.python.PythonUDFRunner$$anon$1.writeIteratorToStream(PythonUDFRunner.scala:53)
   at org.apache.spark.api.python.BasePythonRunner$WriterThread.$anonfun$run$1(PythonRunner.scala:397)
   at org.apache.spark.util.Utils$.logUncaughtExceptions(Utils.scala:1996)
   at org.apache.spark.api.python.BasePythonRunner$WriterThread.run(PythonRunner.scala:232)

Driver stacktrace:
   at org.apache.spark.scheduler.DAGScheduler.failJobAndIndependentStages(DAGScheduler.scala:2258)
   at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2(DAGScheduler.scala:2207)
   at org.apache.spark.scheduler.DAGScheduler.$anonfun$abortStage$2$adapted(DAGScheduler.scala:2206)
   at scala.collection.mutable.ResizableArray.foreach(ResizableArray.scala:62)
   at scala.collection.mutable.ResizableArray.foreach$(ResizableArray.scala:55)
   at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:49)
   at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:2206)
   at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1(DAGScheduler.scala:1079)
   at org.apache.spark.scheduler.DAGScheduler.$anonfun$handleTaskSetFailed$1$adapted(DAGScheduler.scala:1079)
   at scala.Option.foreach(Option.scala:407)
   at org.apache.spark.scheduler.DAGScheduler.handleTaskSetFailed(DAGScheduler.scala:1079)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.doOnReceive(DAGScheduler.scala:2445)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2387)
   at org.apache.spark.scheduler.DAGSchedulerEventProcessLoop.onReceive(DAGScheduler.scala:2376)
   at org.apache.spark.util.EventLoop$$anon$1.run(EventLoop.scala:49)
   at org.apache.spark.scheduler.DAGScheduler.runJob(DAGScheduler.scala:868)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2196)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2217)
   at org.apache.spark.SparkContext.runJob(SparkContext.scala:2236)
   at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:472)
   at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:425)
   at org.apache.spark.sql.execution.CollectLimitExec.executeCollect(limit.scala:47)
   at org.apache.spark.sql.Dataset.collectFromPlan(Dataset.scala:3696)
   at org.apache.spark.sql.Dataset.$anonfun$head$1(Dataset.scala:2722)
   at org.apache.spark.sql.Dataset.$anonfun$withAction$1(Dataset.scala:3687)
   at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$5(SQLExecution.scala:103)
   at org.apache.spark.sql.execution.SQLExecution$.withSQLConfPropagated(SQLExecution.scala:163)
   at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$1(SQLExecution.scala:90)
   at org.apache.spark.sql.SparkSession.withActive(SparkSession.scala:775)
   at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:64)
   at org.apache.spark.sql.Dataset.withAction(Dataset.scala:3685)
   at org.apache.spark.sql.Dataset.head(Dataset.scala:2722)
   at org.apache.spark.sql.Dataset.take(Dataset.scala:2929)
   at org.apache.spark.sql.Dataset.getRows(Dataset.scala:301)
   at org.apache.spark.sql.Dataset.showString(Dataset.scala:338)
   at sun.reflect.GeneratedMethodAccessor146.invoke(Unknown Source)
   at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
   at java.lang.reflect.Method.invoke(Method.java:498)
   at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
   at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
   at py4j.Gateway.invoke(Gateway.java:282)
   at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
   at py4j.commands.CallCommand.execute(CallCommand.java:79)
   at py4j.GatewayConnection.run(GatewayConnection.java:238)
   at java.lang.Thread.run(Thread.java:748)
Caused by: java.net.SocketException: Connection reset by peer: socket write error
   at java.net.SocketOutputStream.socketWrite0(Native Method)
   at java.net.SocketOutputStream.socketWrite(SocketOutputStream.java:111)
   at java.net.SocketOutputStream.write(SocketOutputStream.java:155)
   at java.io.BufferedOutputStream.flushBuffer(BufferedOutputStream.java:82)
   at java.io.BufferedOutputStream.write(BufferedOutputStream.java:126)
   at java.io.DataOutputStream.write(DataOutputStream.java:107)
   at java.io.FilterOutputStream.write(FilterOutputStream.java:97)
   at org.apache.spark.api.python.PythonRDD$.write$1(PythonRDD.scala:295)
   at org.apache.spark.api.python.PythonRDD$.$anonfun$writeIteratorToStream$1(PythonRDD.scala:307)
   at org.apache.spark.api.python.PythonRDD$.$anonfun$writeIteratorToStream$1$adapted(PythonRDD.scala:307)
   at scala.collection.Iterator.foreach(Iterator.scala:941)
   at scala.collection.Iterator.foreach$(Iterator.scala:941)
   at scala.collection.AbstractIterator.foreach(Iterator.scala:1429)
   at org.apache.spark.api.python.PythonRDD$.writeIteratorToStream(PythonRDD.scala:307)
   at org.apache.spark.sql.execution.python.PythonUDFRunner$$anon$1.writeIteratorToStream(PythonUDFRunner.scala:53)
   at org.apache.spark.api.python.BasePythonRunner$WriterThread.$anonfun$run$1(PythonRunner.scala:397)
   at org.apache.spark.util.Utils$.logUncaughtExceptions(Utils.scala:1996)
   at org.apache.spark.api.python.BasePythonRunner$WriterThread.run(PythonRunner.scala:232)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Wenweno0o 2022-04-01 14:25
关注
解决：修改python环境下的pyspark包中的worker. py 中的process函数
（注：python环境下的pyspark包是从spark目录拷贝过来的）
eg: E:\Anaconda3\envs\py27\Lib\site-packages\pyspark\worker. py
定位到 process 函数：

def process(): iterator = deserializer.load_stream(infile) serializer.dump_stream(func(split_index, iterator), outfile) # 添加以下内容 for obj in interator: pass
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

spark Caused by: java.net.SocketException: Connection reset by peer: socket write error
2024-10-31 18:24

小王同学mf的博客在运行 pyspark 代码读取数据后，有时候会出现这个错误。1、将数据量变小一点，只截取一部分进行测试。2、不要使用take算子了。
SparkCore错误分享 Caused by: java.net.SocketException: Connection reset by peer: socket write error
2024-10-31 19:06

深情秋刀鱼..的博客在运行 pyspark 代码读取数据后，有时候会出现这个错误。原因是连接数过多，一般出现这个问题，都是本地 windows 运行 spark 代码，而读取的数据过多，另外就是代码中使用了 take() 这个算子，有两种办法： 1、将...
java.net.SocketException: Connection reset by peer: socket write error
2022-03-15 08:37

好锅煮好饭的博客启动javaweb（Tomcat服务器）的同时建立了一个socket连接；通过点击网页上传文件的按钮，将文件保存到本地，同时调用socketThread线程的发送文件的方法sendfile（）控制器： //socket upFileService ...
【已解决】Caused by: java.net.SocketException: Connection reset by peer: socket write error
2023-10-08 19:41

秒懂AI+的博客 ERROR PythonRunner: Python worker exited unexpectedly (crashed)的意思是Python worker意外退出(崩溃)测试运行print(input_rdd.first())可以打印出来，但是print(input_rdd.count())触发函数就会报错。...
Jedis高并发下操作redis报错：java.net.SocketException: Connection reset by peer: socket write error
2021-12-14 21:04

fo3hd的博客上线后出现问题： java.net.SocketException: Connection reset by peer: socket write error. setNxPx进去redis的value莫名其妙变成字符串：“OK”，我设置的值明明是String.valueOf(System.currentTimeMillis())....
Caused by: java.net.SocketException: Connection reset by peer: socket write error
2021-06-20 21:53

回家种田是我的终极梦想的博客结合异常描述“socket write error”，初步分析是socket在client端或server端的读或写有问题了。。。看一下server端：经过排查，问题出在了上面标红的地方。就是这个newPic文件的路径是错的，所以这个文件不存在...
rabbitmq之java.net.SocketException: Connection reset与MissedHeartbeatException分析
2023-09-25 10:32

lss0555的博客在android前端中接入了rabbitmq消息队列来处理业务，在手机网络环境错综复杂，网络信号不稳定，可能导致mq的频繁断开与连接，在日志中，发现有很多这样的日志，java.net.SocketException: Connection reset，接下来...
SpringBoot集成FastDFS上传小视频错误java.net.SocketException: Connection reset by peer: socket write error
2021-04-20 09:16

大能人powerman的博客项目场景：【场景】：SpringBoot集成FastDFS上传小视频【技术】：SpringBoot+阿里云+Centos8+FastDFS 【说明】：项目采用阿里云ESC搭建FastDFS ...java.net.SocketException: Connection reset by peer
java中用jedis报错_使用Jedis在高并发报错 (java.net.SocketException: Connection reset by peer: socket write error)...
2021-03-15 00:17

袁均林的博客使用Jedis在高并发报错 (java.net.SocketException: Connection reset by peer: socket write error)1.报错信息java.lang.reflect.InvocationTargetException: nullat sun.reflect.GeneratedMethodAccessor15.invoke...
pyspark java.net.SocketException: Connection reset by peer
2019-01-20 11:29

markix的博客在window、运行pyspark...Caused by: java.net.SocketException: Connection reset by peer: socket write error py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.Py...
maven插件构建docker镜像报错Caused by: java.net.SocketException: Connection reset by peer: socket write error
2020-05-23 11:33

代码人生520的博客具体报错如下： Caused by: org.apache.http.client.ClientProtocolException at org.apache.http.impl.client.InternalHttpClient.doExecute(InternalHttpClient.java:186) at org.apache....
java.net.SocketException Connection reset 解决方法
2018-07-11 15:36

"java.net.SocketException Connection reset 解决方法" 在 Java 编程中，SocketException 是一种常见的异常，特别是在网络编程中。Conexion reset by peer 是一种特殊的 SocketException，它发生在客户端和服务器...
Socket java.net.SocketException: Connection reset错误异常的原因及解决
2023-09-08 18:44

锐湃的博客如果一端的Socket被关闭（或主动关闭，或因为异常退出而引起的关闭），另一端仍发送数据，发送的第一个数据包引发该异常(Connect reset by peer)。2). 一端退出，但退出时并未关闭该连接，另一端如果在从连接中读...
[redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketException: Connection reset
2022-03-31 13:47

汪程序猿的博客 2022-03-31 13:42:58.585 ERROR 61596 — [io-8081-exec-10] o.a.c.c.C.[.[.[/].[dispatcherServlet] : Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception ... java.net.
apache FTPClient 操作出现java.net.SocketException: Connection reset by peer: socket write error 踩坑
2018-12-10 18:05

blowDestiny的博客 java.net.SocketException: Connection reset by peer: socket write error 这个错误不是一开始就爆出来了后来测试的时候才发现很蛋疼的一个东西(后面有说为什么说他蛋疼！！！) 过程：一开始就是ftp的搭建我...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月27日

pyspark报错 java.net.SocketException: Connection reset by peer: socket write error

1条回答 默认 最新

问题事件

1条回答默认最新