运行Chatglm3-6b大模型时遇到问题

在使用streamlit运行main.py文件的时候，Loading checkpoint shards一致卡在同一个位置并且自动跳转到下一行命令，这应该如何解决？？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-07-24 14:50
关注
引自免费微信小程序：皆我百晓生

从你提供的描述和日志来看，问题似乎是在加载模型检查点（checkpoint shards）时遇到了困难。模型加载进度停留在同一位置可能有很多原因，包括但不限于内存不足、硬盘读写速度限制、网络问题或模型文件损坏等。在这种情况下，可以采取以下几种方法尝试解决问题：

检查内存和硬盘状况

确保你的计算机有足够的内存和存储空间来加载大模型。检查你的内存使用情况，并确保硬盘有足够的空间进行读写操作。如果内存或硬盘空间不足，考虑升级硬件或清理不必要的文件。

检查网络连接和稳定性

如果模型是从互联网上下载的，确保网络连接稳定并且速度足够快。如果网络不稳定或速度慢，可能会导致加载过程中卡住。

检查模型文件完整性

确认模型文件没有损坏或丢失。你可以尝试重新下载模型文件，或者从另一个可靠的来源获取。

优化模型加载参数和配置

在Streamlit应用中，可能需要调整某些参数设置以提高模型加载速度或解决加载问题。特别是与模型输入和输出设置相关的参数（如eos token、pad token和unk token），虽然提示不支持自定义设置，但可能需要确认是否使用了合适的默认值。此外，也可以尝试调整模型加载时的其他相关参数。

使用更大的内存和计算资源

考虑到你正在运行一个大模型，可能需要更多的内存和计算资源。尝试使用更高配置的计算机或服务器来运行你的应用。

查看日志和错误信息

仔细检查日志中的错误信息，看是否有任何关于内存溢出、文件读取错误或其他相关问题的提示。这些信息可能有助于诊断问题所在。此外，尝试在命令行中运行模型的脚本（而非通过Streamlit），看是否有不同的输出结果或错误信息。有时候直接使用命令行可能会提供关于问题原因的更多线索。考虑到这个任务的复杂性，我暂时无法提供具体的代码示例，因为解决这个问题可能需要多方面的调整和尝试。不过，希望上述建议能帮助你找到问题的根源并解决它。如果问题仍然存在，你可能需要联系模型的开发者或社区寻求进一步的帮助。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在Windows系统下部署运行ChatGLM3-6B模型
2024-08-02 17:46

进击的AI的博客主要讲述关于清华ChatGLM3的部署应用
如何本地化部署大模型ChatGLM3-6B？
2025-02-13 11:06

我爱学大模型的博客在当下的大模型领域，各家厂商纷纷推出各式产品。我精心挑选了一些技术实力较强的代表性产品，详情可见下表（其他产品因篇幅限制就不一一列举了）。实际上，虽然市场上参与者众多，但真正投入巨资进行技术研发的并不...
手把手教大家在本地运行ChatGLM3-6B大模型（一）
2024-03-23 09:04

AI数字化的博客最低要求：为了能够流畅运行 Int4 版本的 ChatGLM3-6B，我们在这里给出了最低的配置要求：内存：>= 8GB 显存: >= 5GB（1060 6GB,2060 6GB）为了能够流畅运行 FP16 版本的，ChatGLM3-6B，我们在这里给出了最低的...
使用LLaMA Factory来训练智谱ChatGLM3-6B模型
2024-09-16 09:15

人工智能MOS的博客使用LLaMA Factory来训练智谱ChatGLM3-6B模型
chatglm-6b源码（不带模型）
2023-10-08 12:31

"ChatGLM-6B源码（不带模型）"是一个与自然语言处理相关的软件或插件项目，其核心是ChatGLM模型的实现。ChatGLM，全称为Chat Generative Language Model，是一种用于生成对话的大型语言模型。源代码没有包含预训练的...
基于chatglm3-6b微调-中医信息问答模型
2024-05-28 17:48

XXmmood的博客 ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：1、更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了...
LLM-02 大模型 ChatGLM3-6B 部署笔记：多卡并行、显存优化与环境配置详解配置、部署全流程实录
2024-04-18 10:19

武子康的博客 ChatGLM3-6B 是智谱AI推出的新一代开源对话模型，在性能、功能和工程优化等方面均有显著提升。基础模型采用更先进的预训练框架和广泛的高质量数据集，在 C-Eval、MMLU、GSM8K 等权威基准测试中表现优异，尤其在数学...
ChatGLM2-6B模型部分文件，不包括bin_ChatGLM2-6B-Files.zip
2024-09-30 14:05

依赖库列表则告诉用户在运行或进一步开发ChatGLM2-6B模型时，需要安装哪些额外的库或工具。这包括了各种编程语言的运行时环境、深度学习框架、以及特定版本的数学或统计库等。最后，运行脚本可能是最接近于“用户...
手把手教你部署并使用清华智谱ChatGLM3-6B大模型
2024-11-12 20:32

Llama-Turbo的博客本文就来分享下我的安装部署经验，包括本地和租用云服务器的方式，以及如何通过API调用大模型开发自己的AI应用，希望能解决一些下不去手的问题。
基于ChatGLM-6B、ChatGLM2-6B、ChatGLM3-6B模型，进行下游具体任务微调，全参微调
2024-02-07 17:11

ChatGLM-6B、ChatGLM2-6B和ChatGLM3-6B是这一系列的不同版本，通常随着版本的升级，模型的参数量更大，性能也更优。这些模型在预训练阶段已经学习了大量的语言模式，但为了适应特定的下游任务，如问答、情感分析或...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月24日

运行Chatglm3-6b大模型时遇到问题

3条回答 默认 最新

检查内存和硬盘状况

检查网络连接和稳定性

检查模型文件完整性

优化模型加载参数和配置

使用更大的内存和计算资源

查看日志和错误信息

问题事件

3条回答默认最新