lxl876 2021-08-20 17:17 采纳率: 0%
浏览 98

spark 运行py程序报错RuntimeError:

测试环境:spark 2.4 + python 3.7
生产环境:spark 2.2 + python 3.7 (环境不能修改)

测试环境能跑通,生产环境报错如下:
21/08/19 16:17:17 ERROR Executor: Exception in task 0.0 in stage 18.0 (TID 18)
org.apache.spark.api.python.PythonException: Traceback (most recent call last):
File "/usr/bch/1.5.0/spark/python/lib/pyspark.zip/pyspark/rdd.py", line 1339, in takeUpToNumLeft
StopIteration

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "/usr/bch/1.5.0/spark/python/lib/pyspark.zip/pyspark/worker.py", line 177, in main
process()
File "/usr/bch/1.5.0/spark/python/lib/pyspark.zip/pyspark/worker.py", line 172, in process
serializer.dump_stream(func(split_index, iterator), outfile)
File "/usr/bch/1.5.0/spark/python/lib/pyspark.zip/pyspark/serializers.py", line 268, in dump_stream
vs = list(itertools.islice(iterator, batch))
RuntimeError: generator raised StopIteration

现在如何在生产环境的情况下 解决这个报错?
感谢指点

  • 写回答

1条回答 默认 最新

  • python收藏家 2021-08-20 17:19
    关注

    生成器 迭代完了 报错。。没有捕获迭代完的异常,按理说 for 循环自带有这种机制,奇怪

    评论

报告相同问题?

问题事件

  • 创建了问题 8月20日

悬赏问题

  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示
  • ¥15 arduino 步进电机
  • ¥20 程序进入HardFault_Handler
  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试