关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
艾格吃饱了
2025-06-21 04:40
采纳率: 98.8%
浏览 0
首页
编程语言
华为昇腾910B运行DeepSeek模型时如何优化性能?
青少年编程
在华为昇腾910B运行DeepSeek模型时,如何优化性能以提高推理速度和降低功耗?常见的技术问题包括:如何合理配置昇腾910B的算力资源,充分利用其AI核心与片上存储?如何针对DeepSeek模型结构进行量化处理,在保证精度的同时减少计算量?此外,如何优化数据传输路径,减少主机与设备间的数据交换延迟?最后,如何利用华为CANN框架特性,对模型算子进行融合与加速,提升整体执行效率?这些问题的解决将显著改善DeepSeek模型在昇腾910B上的运行表现。
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
结题
收藏
举报
0
条回答
默认
最新
查看更多回答(-1条)
向“C知道”追问
报告相同问题?
提交
关注问题
华为
910B
服务器部署
Deep
Seek
-R1-Distill-Qwen-32B
2025-05-30 17:01
周周想钱花的博客
本文详细介绍了在
华为
910B
昇腾
AI推理服务部署
Deep
Seek
大
模型
的完整流程。
基于
昇腾
910B
服务器部署
Deep
Seek
-R1-Distill-Qwen-32B
模型
2025-06-14 14:28
大米_的博客
基于
昇腾
服务器部署
Deep
Seek
-R1-Distill-Qwen-32B
模型
Deep
Seek
私有化部署选型考虑:
模型
参数、
运行
参数、算力硬件、配套生态及软件栈 (建议收藏)
2025-06-30 14:17
deepseek大模型的博客
私有化部署方案的选型考虑...首先需要根据企业实际业务场景需求确定合适的
模型
参数和
运行
参数,再基于推理
性能
、并发需求和投入成本等多维度考虑确定算力硬件,同
时
也需要重点考量 AI 计算卡的配套生态和软件栈支持。
企业内训|基于
华为
昇腾
910B
算力卡的大
模型
部署和调优-上海某央企智算中心
2025-01-21 15:38
TsingtaoAI的博客
近日上海,TsingtaoAI为某央企智算中心交付
华为
昇腾
910B
算力卡的大
模型
部署和调优课程。课程深入讲解如何在
昇腾
NPU上高效地训练、调优和部署PyTorch与Transformer
模型
,并结合实际应用场景,探索如何
优化
和迁移
模型
...
Deep
Seek
V3和R1
2025-02-19 00:01
数据攻城小狮子的博客
Deep
Seek
V3 与 R1 的详细对比分析,内容涵盖
模型
定位、架构设计、
性能
表现等核心维度,并结合结构化图表与数据支撑
华为
昇腾
910 到 950 系列 NPU 深度解析
2025-09-21 20:21
常耀斌的博客
对于行业应用而言,910 系列已在金融风控、能源调度等领域证明价值,而 950 系列将进一步拓展 AI 的应用边界 —— 从支持千亿参数
模型
到万亿参数
模型
,从通用 AI 到科学智能(AI for Science),为新材料研发、气候...
Qwen-2.5、
Deep
Seek
-R1、
Deep
Seek
-V3 核心区别
2025-03-02 21:03
瞬间动力的博客
Qwen-2.5、
Deep
Seek
-R1、
Deep
Seek
-V3 核心区别
LLM每周速递!| 涉及多模态、MoE
模型
、
Deep
seek
推理、Agent安全控制、
模型
量化等
2025-04-14 17:49
AINLPer的博客
紧跟技术发展趋势,快速了解大
模型
最新动态。今天继续总结最近一周的研究动态,本片文章共计梳理了「本周大
模型
(LLMs)的最新研究进展」。
手把手教你在边缘开发板部署
Deep
Seek
系列蒸馏
模型
2025-03-11 10:25
魔乐社区的博客
想要在香橙派上快速部署
Deep
Seek
模型
?魔乐社区联合
华为
昇腾
和香橙派,已为你准备好了“一键资源包” -- AI PC专区,帮助开发者快速上手端侧
模型
推理
Deep
Seek
环境适配实战:从云到端无缝部署的终极方案
2025-03-31 14:49
恶霸不委屈的博客
当AI
模型
需要在10+种芯片、5+种云平台、数百类边缘设备上
运行
时
,如何避免"移植地狱"?
Deep
Seek
通过。
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
6月21日