sparkStreaming运行一段时间发生错误 timeout: timed out

Traceback (most recent call last):
File "/root/apps/a/ReceiveSleepData.py", line 130, in
ssc.awaitTermination()
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/streaming/context.py", line 289, in awaitTermination
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/py4j-0.9-src.zip/py4j/java_gateway.py", line 813, in call
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/py4j-0.9-src.zip/py4j/protocol.py", line 308, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling o43.awaitTermination.
: org.apache.spark.SparkException: An exception was raised by Python:
Traceback (most recent call last):
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/streaming/util.py", line 65, in call
r = self.func(t, *rdds)
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/streaming/dstream.py", line 159, in
func = lambda t, rdd: old_func(rdd)
File "/root/apps/a/het.zip/het/action/SleepD.py", line 100, in
join_rdd.foreachRDD(lambda x:processRdd(x))
File "/root/apps/a/het.zip/het/action/SleepD.py", line 41, in processRdd
rdd.foreachPartition(lambda it: sendMattressStatus(it))
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 764, in foreachPartition
self.mapPartitions(func).count() # Force evaluation
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 1004, in count
return self.mapPartitions(lambda i: [sum(1 for _ in i)]).sum()
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 995, in sum
return self.mapPartitions(lambda x: [sum(x)]).fold(0, operator.add)
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 869, in fold
vals = self.mapPartitions(func).collect()
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 772, in collect
return list(_load_from_socket(port, self._jrdd_deserializer))
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 142, in _load_from_socket
for item in serializer.load_stream(rf):
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/serializers.py", line 139, in load_stream
yield self._read_with_length(stream)
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/serializers.py", line 156, in _read_with_length
length = read_int(stream)
File "/opt/cloudera/parcels/CDH-5.7.2-1.cdh5.7.2.p0.18/lib/spark/python/lib/pyspark.zip/pyspark/serializers.py", line 543, in read_int
length = stream.read(4)
File "/usr/local/python2.7/lib/python2.7/socket.py", line 380, in read
data = self._sock.recv(left)

    at org.apache.spark.streaming.api.python.TransformFunction.callPythonTransformFunction(PythonDStream.scala:95)
    at org.apache.spark.streaming.api.python.TransformFunction.apply(PythonDStream.scala:78)
    at org.apache.spark.streaming.api.python.PythonDStream$$anonfun$callForeachRDD$1.apply(PythonDStream.scala:189)
    at org.apache.spark.streaming.api.python.PythonDStream$$anonfun$callForeachRDD$1.apply(PythonDStream.scala:189)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply$mcV$sp(ForEachDStream.scala:50)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply(ForEachDStream.scala:50)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply(ForEachDStream.scala:50)
    at org.apache.spark.streaming.dstream.DStream.createRDDWithLocalProperties(DStream.scala:426)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply$mcV$sp(ForEachDStream.scala:49)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply(ForEachDStream.scala:49)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply(ForEachDStream.scala:49)
    at scala.util.Try$.apply(Try.scala:161)
    at org.apache.spark.streaming.scheduler.Job.run(Job.scala:39)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply$mcV$sp(JobScheduler.scala:224)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply(JobScheduler.scala:224)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply(JobScheduler.scala:224)
    at scala.util.DynamicVariable.withValue(DynamicVariable.scala:57)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler.run(JobScheduler.scala:223)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
    at java.lang.Thread.run(Thread.java:745)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-11-19 15:58
关注
http://blog.csdn.net/sdujava2011/article/details/49796439

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

java.net.ConnectException: Connection timed out (Connection timed out) linux mongodb redis
2021-09-30 14:04

回答 3 已采纳内网访问外网是没问题，可能是linux的防火墙问题，也可能是linux没有请求外网的权限
求解决困扰几天了：数据库连接超时： Connection timed out: connect java mysql 有问必答
2021-03-09 14:27

回答 13 已采纳你写个简单的 demo，然后连一下这个数据库试试呢，就用 DriverManager.getConnection(url, username, password) 试试。先看看是环境还问题，还是其他问
python中用connect函数连接时总是提示TimeoutError: timed out python websocket
2022-01-13 22:06

回答 3 已采纳查看下计算机21端口。
Spark程序运行常见错误解决方法以及优化
2021-07-07 11:17

大数据学习僧的博客执行spark任务遇到数据量巨大的表时，任务经常出现心跳超时报错 ... This timeout is controlled by spark.rpc.askTimeout at org.apache.spark.rpc.RpcTimeout.org$apache$spark$rpc$RpcTimeout$$createRpcTime
nginx 报错upstream timed out (110:Connection timed out) linux nginx
2020-05-11 20:16

回答 2 已采纳网络策略未开通
hive | o.a.thrift.transport.TTransportException: java.net.SocketTimeoutException: Read timed out flink hive spark
2021-12-15 08:56

回答 2 已采纳 [HIVE-22196] Socket timeouts happen when other drivers set DriverManager.loginTimeout - ASF JIRA程序中使
ssh connect to host master port 22: connection time out lost connectiin java
2022-10-07 21:22

回答 2 已采纳可以用ping试试能不能互通；检查一下防火墙
Spark常见错误问题汇总
2020-07-18 12:37

王知无(import_bigdata)的博客一.SparkSQL相关在执行insert 语句时报错，堆栈信息为：FileSystem closed。常常出现在ThriftServer里面。原因：由于hadoop FileSystem.get 获得的FileSystem会从缓存加载，如果多线程一个线程...
scrapy部署在服务器运行一段时间出现ERROR: Error downloading selenium ubuntu 爬虫
2022-08-09 17:43

回答 1 已采纳服务器掉网？？应该不会，你在服务器的那个控制平台不是可以看网络监控嘛？应该不是断网的问题。可能就是被反爬，你爬的数据多，一段时间内请求多，一般都会被反扒，而你又没有设置代码
ssh连接linux服务器出现Connection timed out linux ssh tcp/ip
2021-11-28 12:30

回答 2 已采纳解决了，改一个端口就好了
linux scp报超时Connection timed out lost connection linux ssh 服务器
2022-06-17 12:48

回答 1 已采纳你得先确认服务器的ssh开启了没有，已开启的话，默认端口22是否有修改
大数据技术之Hadoop阶段考试题及答案
2020-12-24 09:27

白白_bai白白的博客 大数据技术之Hadoop阶段考试题及答案hadoop入门HDFS hadoop 入门 1.简要描述如何安装配置apache的一个开源Hadoop，只描述即可，无需列出具体步骤，列出具体步骤更好。 1)准备三台客户机（配置IP，配置主机名…） 2)...
linux nfs mount：mount.nfs: Connection timed out linux 服务器
2016-12-15 05:48

回答 2 已采纳自己解决了，重启服务器解决问题
大数据实时流计算详解
2022-07-13 16:12

办公模板库素材蛙的博客针对公司业务需求，我开发了一个实时流计算系统，并在此基础上完成了风控系统的研发。最终，这个系统被一个独角兽收购。最近这两年，越来越多的业务和数据分析对实时性提出更高的要求，与之对应解决实时计算问题的流...
Hadoop生态圈 大数据文档
2021-12-01 09:45

BigData_XiaoBai的博客文档基于介绍基于Hadoop的大数据生态圈。介绍下图每一个组件的使用场景及使用方法，同时还对每一个组件有更深入的介绍。 ...
Spark常见问题汇总
2019-07-31 18:13

伊豚的博客整理工作中遇见的Spark问题，希望能给大家在使用Spark或者运维Spark如果遇到类似的问题可以参考进行解决一.SparkSQL相关在执行insert 语句时报错，堆栈信息为：FileSystem closed。常常出现在ThriftServer里面。...
大数据中的各类框架优化
2023-10-27 20:55

趁.的博客一、Hive 一）计算资源调优基于Hive on MR 1.1 Yarn资源配置 yarn-site.xml 一个NodeManager节点分配给Container使用的内存，取决于NodeManager所在节点的总内存容量和该节点运行的其他服务的数量（默认8G，3台...
Spark常见报错与问题解决方法
2020-04-21 14:52

书忆江南的博客 1.org.apache.spark.SparkException: Kryo serialization failed: Buffer overflow 原因：kryo序列化缓存空间不足。解决方法：增加参数，--confspark.kryoserializer.buffer.max=2047m。 2.org.elasticsearch....
2022年最新版 | Flink经典线上问题小盘点
2022-01-12 23:23

王知无(import_bigdata)的博客点击上方蓝色字体，选择“设为星标”回复”面试“获取更多惊喜本文已经加入「大数据成神之路PDF版」中提供下载。你可以关注公众号，后台回复：「PDF」即可获取。2020年和2021年分别写了...
没有解决我的问题, 去提问

悬赏问题

¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题
¥15 教务系统账号被盗号如何追溯设备
¥20 delta降尺度方法，未来数据怎么降尺度
¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet，要求快速高效
¥15 再不同版本的系统上，TCP传输速度不一致
¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题