关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
Z2_
2023-06-07 10:01
采纳率: 100%
浏览 20
首页
编程语言
已结题
请问分布式训练卡顿超时该怎么解决啊
python
pytorch
深度学习
在训练语义分割模型cmx时遇到了如下问题,应该是分布式训练(ddp)时出现了卡顿,请问该怎么解决啊
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
0
条回答
默认
最新
查看更多回答(-1条)
向“C知道”追问
报告相同问题?
提交
关注问题
聊一聊深度学习
分布式
训练
2022-06-01 14:05
kaiyuan_sjtu的博客
作者|杨阳整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/365662727在深度学习时代,
训练
数据特别大的时候想要...主要从以下几个方面进行总结:
分布式
训练
的基本原理TensorFlow的
分布式
训练
PyTorch的
分布式
训练
框架H...
【深度学习】聊一聊深度学习
分布式
训练
2022-06-06 12:00
风度78的博客
作者|杨阳整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/365662727在深度学习时代,
训练
数据特别大的时候想要...主要从以下几个方面进行总结:
分布式
训练
的基本原理TensorFlow的
分布式
训练
PyTorch的
分布式
训练
框架H...
告别图像识别服务
卡顿
:Apache Thrift
分布式
架构实战指南
2025-10-19 05:12
叶准鑫Natalie的博客
本文将以Apache Thrift为核心,构建一套高性能图像识别服务架构,
解决
上述痛点。读完本文你将掌握:Thrift IDL定义图像数据结构、多语言服务串联、异步通信优化三大关键技能,让你的视觉服务吞吐量提升300%。 ## 为...
一文带你吃透Python网络编程,小白必看!
2025-05-18 14:56
大雨淅淅的博客
网络编程是构建现代网络应用的基石,Python 作为一种强大的
编程语言
,为我们提供了丰富的工具和库,使得网络编程变得更加高效和有趣。希望大家通过本文的学习,能够对 Python 网络编程产生浓厚的兴趣,并在实际项目...
大数据领域
分布式
存储的智能存储管理系统
2025-12-29 00:05
AI应用架构探索者的博客
一个稳固、可管理的
分布式
存储基础架构。构建全面的、实时的高维度监控数据采集网络。运用规则引擎、统计分析、机器学习等技术,打造强大的分析和决策引擎,实现预测、诊断、优化。安全、可靠地自动化执行决策动作,...
2、探索
分布式
系统中的不可变架构
2025-11-09 00:18
z2a3b4c5d的博客
本文探讨了
分布式
系统中的不可变架构,分析了传统
分布式
系统面临的挑战,如网络不可靠、延迟、拓扑变化...结合实际场景,展示了不可变如何
解决
共享状态、并发冲突和数据一致性难题,为现代
分布式
系统设计提供了新思路。
告别踩坑!2026最适配中文开发者的AI编程助手推荐
2025-12-26 20:44
资深程序员 哈克(21年开发经验)的博客
作为一名深耕Java开发8年的老程序员,我曾是海外AI编程工具的忠实用户——从GitHub Copilot到Cursor,几乎尝遍了主流产品。但长期使用中,那些被忽略的“本土化痛点”逐渐成为效率杀手:写中文注释时AI频繁理解偏差...
从单机到
分布式
:高等教育AI智能体的架构演进之路
2026-01-11 02:25
AI Native APP 开发前沿的博客
代码模块化与复用:在实现
分布式
AI智能体时,将不同功能模块进行合理划分,如数据处理模块、模型
训练
模块、任务调度模块等。这样不仅便于代码的维护和扩展,还可以提高代码的复用性,减少开发成本。容错处理:在...
Flink 在爱奇艺广告业务的实践
2022-05-09 07:49
pucheung的博客
特征工程:广告算法团队主要是做一些模型
训练
,用于支持线上投放。技术特征最初大部分是离线,随着实时的发展,开始把一些工程转到实时。 二、业务实践 业务实践主要分为两类,第一个是实时数仓,第二个是特征工程...
面向5G的阿里自研标准化协议库XQUIC
2020-08-11 16:20
阿里巴巴淘系技术团队官网博客的博客
在直播高峰期场景,
卡顿
率降低30%、秒开率提升2% 在短视频场景,
卡顿
率降低20% 从以上提升效果可以看出,对QUIC的一个常见认知谬误:“QUIC只对弱网场景有优化提升”是不准确的。实际上QUIC对于整体网络体验有普遍...
腾讯Java后端一面,被速通了!
2025-04-27 15:20
JavaGuide的博客
这次面试的考察覆盖了从 项目经验的深度挖掘(面试官非常看重 STAR 法则的应用)到 扎实的计算机基础(经典的 TCP/UDP 对比、MySQL 事务与 MVCC 原理),再到
分布式
系统 的核心概念(如
分布式
锁的必要性与 Redis ...
程序员的数学(二十二)数学思维的反哺与传承:让能力生长出更多可能
2026-01-04 08:36
倔强的小石头_的博客
第二部分强调将数学思维转化为团队共同语言,例如用向量空间模型统一模糊需求沟通。文章通过具体代码案例展示了数学思维从个人技能到组织财富的转化路径,体现了其作为"决策引擎"的核心价值。
用ApacheZeppelin进行基于SQL的数据查询和分析
2023-07-19 00:57
光子AI的博客
其提供基于 SQL 的查询语言、可视化图表展示功能、SQL 代码自动补全、多种
编程语言
支持、数据导入导出功能等。Zeppelin 支持大数据处理、机器学习、流计算、金融数据分析等场景,可用于企业内部系统的快速开发与部署...
阿里XQUIC:标准QUIC实现自研之路
2020-08-12 08:00
LiveVideoStack_的博客
截止目前,IETF工作组草案已经演化到draft-29版本(2020.6.10发布),XQUIC已经支持该版本,并能够与其他开源实现基于draft-29互通。 XQUIC整体架构和传输框架设计 XQUIC是IETF QUIC草案版本的一个C协议库实现,...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
系统已结题
6月15日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
6月7日