Kaldi在训练过程中没有报错但是在固定点退出

退出时的日志输出如下所示：

没有报错，max-jobs-run设为10，训练了三次每次到这里都会退出。服务器为8个CPU，100G的内存。请问是哪里出了问题呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
你知我知皆知 2024-07-23 23:52
关注
以下回答参考 皆我百晓生、券券喵儿 等免费微信小程序相关内容作答，并由本人整理回复。

从您提供的日志信息来看，您的Kaldi训练过程似乎遇到了一些问题。具体来说：

您提到在训练过程中没有报错，但是当达到最大进程数（--max-jobs-run 10）时就会自动退出。这可能是由于您的系统资源限制导致的。

在训练结束后，可以看到训练结果和配置文件都在正常运行，但最终还是无法完成训练。这可能是因为训练过程中的某些步骤出现问题，例如训练器或模型参数设置不当等。

每次训练后都出现“max-jobs-run 10”这个命令行选项，并且这个选项在不同的阶段有不同的含义。这表明可能是在训练的不同部分使用了不同数量的进程。

为了确定问题的具体原因，您可以尝试以下步骤来进一步分析和解决问题：

检查环境变量：确保在每个训练阶段中使用的环境变量（比如OMP_NUM_THREADS、OPENBLAS_NUM_THREADS等）与上一个阶段保持一致。

检查训练参数：确认在每个阶段开始前对模型参数进行了适当的调整。如果参数不合适，可能会导致训练失败。

检查训练数据：检查训练数据的质量是否足够高，以支持有效的训练。如果数据不正确或者过小，可能导致训练效果不佳。

检查训练工具：确保训练工具（比如run.pl）正在正确地处理所有输入参数。如果遇到错误提示，可以查看相关的错误日志，看看是否有特定的错误发生。

查看输出日志：通过查看训练过程中的输出日志，特别是关于进程管理的信息，可以更好地了解训练过程中的情况。

考虑升级硬件资源：如果上述方法都不能解决问题，可能需要考虑升级服务器的硬件资源，比如增加更多的CPU核心和内存容量，以便更好地应对大规模的数据集和复杂的训练任务。

总之，要解决这些问题，可能需要仔细分析整个训练流程，包括输入数据质量、训练参数选择、以及如何有效地利用系统的资源。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

kaldi使用生成G.fst报错 linux 语音识别
2023-03-31 21:23

回答 1 已采纳这个错误通常是因为缺少OpenFst工具库中的命令行工具arpa2fst导致的。arpa2fst是将ARPA格式语言模型转换为FST二进制格式的工具。您需要确保安装了OpenFst库，最好是在命令行中
kaldi在做实时线上语音识别系统遇到问题 linux 人工智能语音识别
2023-04-10 20:54

回答 2 已采纳该回答通过自己思路及引用到GPTᴼᴾᴱᴺᴬᴵ搜索,得到内容具体如下：根据输出的错误信息，可以看出在运行时遇到了两个问题： 1. "tar: online-data.tar.bz2：无法 open:
Kaldi aishell訓練自己的資料 linux python
2022-07-19 18:09

回答 1 已采纳 kaldiaishell2数据集训练以及生成文件详细分析（步骤+部分代码解释） - 百度文库
kaldi在java中运行_Kaldi 模型训练与测试流程
2021-03-08 00:29

CodeWizardess的博客 Kaldi 模型训练与测试流程先决条件要学习Kaldi 有一些先决条件要具备Linux:Kalid本身是在Linux下开发和测试运行的，虽然官方给了在Windows下用VS编译运行的方法，但我没有成功，坑比较多，除非你对Windows VS很熟，...
声纹识别，选择pytorch好还是kaldi？ c++ pytorch 开发语言
2021-11-08 14:54

回答 2 已采纳比较推荐pytorch，因为C++比较复杂,环境配置也容易出错，对研究生科研而言，python相对简单，；而且pytorch也可以调用kaldi pytorch-kald
kaldi运行aishell1的时候遇到steps/train_mono.sh: line 79: train_cmd: command not found的问题 linux 语音识别
2023-04-08 09:48

回答 1 已采纳当在运行Kaldi的Aishell1示例时，遇到steps/train_mono.sh: line 79: train_cmd: command not found错误，通常是由于Kaldi的命令和脚
kaldi自由说训练好的模型
2020-07-08 09:28

利用从网上下载的kaldi源码和语音数据，训练好的支持自由说的模型，是模型，模型，模型！不是源码，也不是其他的语音资源文件，需要的朋友可以下载下来，结合kaldi中eg5/aishell/s5的例子使用！
kaldi编译安装过程出现的报错
2019-10-09 15:07

余神自不凡的博客 kaldi编译安装过程出现的报错主要包括未定义的引用，make[1]，recipe error for target ' 'failed等问题传统编译模式我出现的问题和解决方式出现问题解决主要包括未定义的引用，make[1]，recipe error for target ...
kaldi在java中运行_kaldi实例脚本运行
2021-03-08 00:29

夙砂酒的博客 Getting started, and prerequisites.rm/s5/run.shData preparation如果有GridEngine,train_cmd="queue.pl -q all.q@a*.clsp.jhu.edu"decode_cmd="queue.pl -q all.q@[ah]*.clsp.jhu.edu"如果需要在本地运行train_...
kaldi在java中运行_Kaldi语音识别CVTE模型实战
2021-03-08 00:29

weixin_39876514的博客解压，tar -zxvf0002_cvte_chain_model_v2.tar.gz 备注：因HCLG.fst模型解压后文件较大，在解压过程中会出现停顿，等待片刻即可！ 3.将egs/wsj/s5中的steps和utils拷贝到egs/cvte/s5目录下 4.将egs/hkust/s5/local/...
Kaldi中aishell语料训练结果（kaldi_aishell_exp.txt）
2021-07-22 17:38

包含mono、tri1、tri2、tri3a、tri4a、tri5a已训练好的mdl、fst等文件，不包含dnn训练结果
kaldi在linux上编译,Kaldi的编译过程
2021-05-11 22:21

空间一号的博客目录本文介绍Kaldi的编译过程。在Windows下编译不建议在Windows下编译。configure脚本是怎么工作的configure脚本有很多参数，其中一种用法是：./configure --shared上面的–shared会构建动态库，这样的程序会小一点...
kaldi在java中运行_ubuntu下kaldi的安装以及实例的运行
2021-03-08 00:29

chao wang的博客一、安装所有相关软件包sudo apt-get install autoconf,automake,gcc,libtool,subversion,libatlas-dev,libatlas-base-dev,gfortran二、下载kaldi到目录kaldi-trunksvn co ...三、编译...
ivector-xvector：在kaldi下提取xvector和ivector
2021-02-05 18:48

Kaldi用于ivector和xvector的摘要文件清单 ivector/ conf/ ：为mfcc和vad配置文件 wav/ ：测试音频（您也可以使用自己的wav路径，请参阅步骤1 ）仅支持flac（安装flac），wav和sph（安装sph2pipe） model_3000h...
kaldi在linux上编译,Kaldi在Linux下的安装和编译
2021-05-11 22:21

weixin_39943926的博客 1.介绍Kaldi语音识别工具将HTK比较零碎的各种各样的指令和功能进行整理集合，使用perl脚本调用。同时也加入了深度神经网络的分类器(DNN)，本身由原来做HTK开发的人员制作而成，可以说是HTK的升级加强版。kaldi官方...
语音识别：在Kaldi上使用CVTE模型-已训练好的开源中文ASR模型
2021-11-07 14:37

Keep828的博客在前一篇文章中，我把Kaldi安装并编译了。相当于把利用Kaldi做语音识别的基本运行环境布置好了。这一篇文章记录我用CVTE开源的kaldi模型来进行语音识别模型的建立和使用。一、CVTE模型简介及下载 CVTE Mandarin ...
kaldi在java中运行_linux下运行Kaldi中文例子(thchs30，清华大学30小时语音)
2021-03-08 00:30

山奈酚的博客一、安装配置Kaldi二、下载语音数据#The database can be downloaded from openslr:http://www.openslr.org/18/or from the CSLT server:http://data.cslt.org/thchs30/README.html下载完之后，在kaldi/egs/thchs30/...
Kaldi 单音素模型训练流程与总结
2019-09-21 21:52

倚剑笑紅尘的博客文章目录脚本原理总体的流程介绍：流程1....训练单音素模型2.1align-equal-compiled.cc和gmm-align-compiled2.2gmm-acc-stats-ali2.3gmm-sum-accs2.4gmm-est模型参数输出解释：提醒资料专业名词的解释脚本 ais...
Kaldi语音识别技术(七) ----- 训练GMM
2023-02-21 17:52

Python-AI Xenon的博客整个过程分为10个环节，其中有5个是与对齐相关的，为了方便理解，这10个环节，只讲其中的2个（**train_mono 单因素训练模型和align_si对齐**），其他的基本都是进行优化。整个GMM训练模型的过程就是这样。总的来说，...
没有解决我的问题, 去提问

悬赏问题

¥15 CPU卡指令整合指令数据都在图片上
¥15 火车票关联12306问题
¥15 odoo17处理受托加工产品
¥15 如何用MATLAB编码图三的积分
¥15 圆孔衍射光强随孔径变化
¥15 MacBook pro m3max上用vscode运行c语言没有反应
¥15 ESP-PROG配置错误，ALL ONES
¥15 结构功能耦合指标计算
¥50 AI大模型精调（百度千帆、飞浆）
¥15 非科班怎么跑代码？如何导数据和调参

Kaldi在训练过程中没有报错但是在固定点退出

1条回答 默认 最新

悬赏问题

1条回答默认最新