大数据，spark ，doris

使用spark 向Doris插入数据，报：node and exceeded the max retry times
3个datefarm 做union 并做repartition（200）
求big-old讲解

23/01/17 21:49:50 INFO scheduler.TaskSetBlacklist: Blacklisting worker50.center.lon for stage 123
23/01/17 21:49:50 WARN scheduler.TaskSetManager: Lost task 28.0 in stage 123.0 (TID 10275, worker50.center.lon, executor 3): java.io.IOException: Failed to load data on BE: http://xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx? node and exceeded the max retry times.
        at org.apache.doris.spark.sql.DorisSourceProvider$$anonfun$createRelation$1$$anonfun$org$apache$doris$spark$sql$DorisSourceProvider$$anonfun$$flush$1$1.apply$mcV$sp(DorisSourceProvider.scala:118)
        at scala.util.control.Breaks.breakable(Breaks.scala:38)
        at org.apache.doris.spark.sql.DorisSourceProvider$$anonfun$createRelation$1.org$apache$doris$spark$sql$DorisSourceProvider$$anonfun$$flush$1(DorisSourceProvider.scala:92)
        at org.apache.doris.spark.sql.DorisSourceProvider$$anonfun$createRelation$1.apply(DorisSourceProvider.scala:83)
        at org.apache.doris.spark.sql.DorisSourceProvider$$anonfun$createRelation$1.apply(DorisSourceProvider.scala:68)
        at org.apache.spark.rdd.RDD$$anonfun$foreachPartition$1$$anonfun$apply$28.apply(RDD.scala:935)
        at org.apache.spark.rdd.RDD$$anonfun$foreachPartition$1$$anonfun$apply$28.apply(RDD.scala:935)
        at org.apache.spark.SparkContext$$anonfun$runJob$5.apply(SparkContext.scala:2121)
        at org.apache.spark.SparkContext$$anonfun$runJob$5.apply(SparkContext.scala:2121)
        at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:90)
        at org.apache.spark.scheduler.Task.run(Task.scala:121)
        at org.apache.spark.executor.Executor$TaskRunner$$anonfun$11.apply(Executor.scala:407)
        at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1408)
        at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:413)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
        at java.lang.Thread.run(Thread.java:748)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
流比 2023-01-17 22:12
关注
这是一个连接Doris服务器失败的错误，具体原因可能是Doris服务器无法连接或网络故障导致的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

大数据，spark ，doris mysql spark 大数据
2023-01-17 22:05

回答 2 已采纳这是一个连接Doris服务器失败的错误，具体原因可能是Doris服务器无法连接或网络故障导致的。
请教：通过httpclient方式向doris导入数据出错“no valid Basic authorization”是怎么回事？大数据有问必答
2021-08-10 17:35

回答 4 已采纳老哥，我这边已经解决啦，重定向的时候默认是把密码丢了，你得检测重定向把账户密码放进去
FlinkSQL平台化，前端化管理 flink java 大数据
2023-02-01 10:55

回答 4 已采纳题主的思路完全正确可行，因为我就是这么做的。也是一开始觉得不是很正规，但确实能解决实际的业务问题，要相信自己。梳理一下BaseJar：丢到linux服务器上，用来解析Flink SQL语句MySQ
大数据Doris（六十二）：Spark Doris Connector代码操作
2024-01-31 11:09

Lansonli的博客 Spark Doris Connector 可以支持通过 Spark 读取 Doris 中存储的数据。编译成功后，会在 output/ 目录下生成文件。将此文件复制到 Spark 的 ClassPath 中即可使用 Spark-Doris-Connector。例如：Local 模式运行的 ...
Doris新增字段再插入问题 java 数据库
2022-11-08 10:17

回答 3 已采纳官方有说明，改表是异步操作，会立即返回，你不能马上就插入的
doris-0.14.7部署集群BE一直启动失败百度云
2021-06-08 18:14

回答 1 已采纳已经解决了，是端口冲突，webserver_port 换一个就可以了。啊啊啊啊菜鸟看不懂日志信息啊啊，不知道是这个端口冲突。
为什么我使用Stream_load方式导入数据会报：content-length header already present的错误，同样的代码，另一台电脑就没有报错。有没有遇到相同问题的，帮个忙？ http java maven 有问必答
2021-09-07 20:08

回答 1 已采纳我看这里是定义了一个ContentLengthHeaderRemover参考一下吧 doris stream load_有机合成研究员的博客-CSDN博客还不错，就是5M
大数据 - Doris系列《一》- Doris简介
2024-01-04 12:25

王哪跑nn的博客 Doris是一款开源的分布式OLAP（联机分析处理）数据库引擎，旨在支持高并发、大规模的数据查询和分析需求。本篇文章将深入介绍OLAP和OLTP的区别，明确它们在用户行为日志数据场景中的应用。我们将比较OLAP和OLTP在...
hive数据表array类型列导入数据为空 hive 有问必答
2022-02-26 20:05

回答 3 已采纳你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为
出现1064, 怎么解决，什么原因？ mysql python
2021-07-31 14:28

回答 1 已采纳是sql读法错误，执行语句中是drop table 而不是dorp table,改一下即可
DB Navigator - Script execution error idea intellij-idea mysql
2022-08-10 20:35

回答 1 已采纳显然这个操作是调用本地MySQL客户端执行命令，然而你本地并没有装MySQL的客户端所以报错了。换数据库连接工具试试，navicat或者dbeaver
【大数据】Doris 构建实时数仓落地方案详解（二）：Doris 核心功能解读
2023-09-18 23:07

G皮T的博客 Apache Doris 是由百度研发并开源的数据库项目。 Doris 2008 年开始在百度内部立项，经历了五个大版本的迭代后于 2017 年开源，2018 年进入 Apache 基金会孵化项目。2022 年 4 月 18 日正式发布 Doris 1.0，2022 年 ...
flink消费kafka数据延迟 flink postgresql scala 有问必答
2022-01-28 09:47

回答 1 已采纳那最后写入到库了吗，如果写不进去，上游kafka肯定会延迟越来越大的，可以在sink里多打印下错误，或者设置写入超时时间，问题应该在写入
大数据技术-Doris学习笔记
2022-04-27 10:59

笑一笑、的博客 大数据技术-Doris学习笔记
Apache Doris (六十二）： Spark Doris Connector - (2)-使用
2024-01-06 11:45

IT贫道的博客个人主页：IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客私聊博主：加入大数据技术讨论群聊，获取更多大数据资料。博主个人B栈地址：豹哥教你学编程的个人空间-豹哥教你学编程个人主页-...
2023大数据面试题，很全
2023-06-08 13:48

在大数据领域，面试题通常围绕着核心技术进行，如Hadoop、Spark、Flink等。本文将重点解析Hadoop的相关知识点，帮助你深入理解和掌握这些技术。 ### Hadoop #### 1. HDFS（Hadoop Distributed File System）读写...
Doris集成Spark读写的简单示例
2023-03-05 08:00

WHYBIGDATA的博客 Doris集成Spark读写的简单示例
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月17日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

大数据，spark ，doris

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新