关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
Z2_
2023-06-07 10:01
采纳率: 100%
浏览 20
首页
编程语言
已结题
请问分布式训练卡顿超时该怎么解决啊
python
pytorch
深度学习
在训练语义分割模型cmx时遇到了如下问题,应该是分布式训练(ddp)时出现了卡顿,请问该怎么解决啊
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
0
条回答
默认
最新
查看更多回答(-1条)
向“C知道”追问
报告相同问题?
提交
关注问题
聊一聊深度学习
分布式
训练
2022-06-01 14:05
kaiyuan_sjtu的博客
作者|杨阳整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/365662727在深度学习时代,
训练
数据特别大的时候想要...主要从以下几个方面进行总结:
分布式
训练
的基本原理TensorFlow的
分布式
训练
PyTorch的
分布式
训练
框架H...
【深度学习】聊一聊深度学习
分布式
训练
2022-06-06 12:00
风度78的博客
作者|杨阳整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/365662727在深度学习时代,
训练
数据特别大的时候想要...主要从以下几个方面进行总结:
分布式
训练
的基本原理TensorFlow的
分布式
训练
PyTorch的
分布式
训练
框架H...
一文带你吃透Python网络编程,小白必看!
2025-05-18 14:56
大雨淅淅的博客
网络编程是构建现代网络应用的基石,Python 作为一种强大的
编程语言
,为我们提供了丰富的工具和库,使得网络编程变得更加高效和有趣。希望大家通过本文的学习,能够对 Python 网络编程产生浓厚的兴趣,并在实际项目...
大数据领域
分布式
存储的智能存储管理系统
2025-12-29 00:05
AI应用架构探索者的博客
一个稳固、可管理的
分布式
存储基础架构。构建全面的、实时的高维度监控数据采集网络。运用规则引擎、统计分析、机器学习等技术,打造强大的分析和决策引擎,实现预测、诊断、优化。安全、可靠地自动化执行决策动作,...
告别踩坑!2026最适配中文开发者的AI编程助手推荐
2025-12-26 20:44
资深程序员 哈克(21年开发经验)的博客
作为一名深耕Java开发8年的老程序员,我曾是海外AI编程工具的忠实用户——从GitHub Copilot到Cursor,几乎尝遍了主流产品。但长期使用中,那些被忽略的“本土化痛点”逐渐成为效率杀手:写中文注释时AI频繁理解偏差...
AI 编程时代,大学生如何提高自身核心竞争力
2026-04-23 12:02
汤姆yu的博客
AI 编程时代,大学生如何提高自身核心竞争力
从零到一,手把手带你搞定AI Agent的Skills搭建,让你的智能体真正能用、好用、耐用
2026-03-27 16:07
小程故事多_80的博客
摘要: AI Agent的Skills是连接大模型与业务场景的核心能力单元,决定了智能体的任务...关键点在于从业务出发,选择匹配的技术栈(低代码/编程开发),并通过数据清洗与标注优化技能精度。这一流程兼顾效率与灵活性,助
AI提示系统架构设计:从单体到
分布式
的转型之路
2026-03-09 02:17
AI量化价值投资入门到精通的博客
本文深入探讨了 AI 提示系统从单体架构向
分布式
架构转型的各个方面。首先分析了单体架构在 AI 提示系统中的优点与局限性,明确了转型的必要性。接着阐述了
分布式
架构的设计原则,包括功能拆分、数据一致性、负载均衡...
从单机到
分布式
:高等教育AI智能体的架构演进之路
2026-01-11 02:25
AI Native APP 开发前沿的博客
代码模块化与复用:在实现
分布式
AI智能体时,将不同功能模块进行合理划分,如数据处理模块、模型
训练
模块、任务调度模块等。这样不仅便于代码的维护和扩展,还可以提高代码的复用性,减少开发成本。容错处理:在...
青少年能力提分
训练
体系
2026-04-24 09:22
wy20020314的博客
错误日志里开始大量出现“同步等待
超时
”、“获取
分布式
锁失败”的报错。问题似乎出在协调多个微服务进行“学习状态同步”的那个核心组件上。 这个组件的逻辑是这样的:一个学生做完练习,前端发起提交;一个服务...
Flink 在爱奇艺广告业务的实践
2022-05-09 07:49
pucheung的博客
特征工程:广告算法团队主要是做一些模型
训练
,用于支持线上投放。技术特征最初大部分是离线,随着实时的发展,开始把一些工程转到实时。 二、业务实践 业务实践主要分为两类,第一个是实时数仓,第二个是特征工程...
面向5G的阿里自研标准化协议库XQUIC
2020-08-11 16:20
阿里巴巴淘系技术团队官网博客的博客
在直播高峰期场景,
卡顿
率降低30%、秒开率提升2% 在短视频场景,
卡顿
率降低20% 从以上提升效果可以看出,对QUIC的一个常见认知谬误:“QUIC只对弱网场景有优化提升”是不准确的。实际上QUIC对于整体网络体验有普遍...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
6月15日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
6月7日