MockingBird社区分享的模型训练版本不一致

之前的问题我自己解决了，就是在文本里少打了个空格。
现在到最后一步了，又出现一个问题，我用MockingBird社区分享的模型训练报错，提示我模型和代码版本不一致，我该怎么修改版本？
这是模型名字，名字可能就是版本：pretrained-11-7-21_75k.pt

还有，我想用GPU训练，但是现在默认是CPU训练

Microsoft Windows [版本 10.0.19045.2965]
(c) Microsoft Corporation。保留所有权利。

H:\MockingBird>python pre.py H:\制作数据集 -d aidatatang_200zh -n 7
Using data from:
    H:\制作数据集\aidatatang_200zh\corpus\train
aidatatang_200zh: 100%|████████████████████████████████████████████████████████████| 1/1 [00:48<00:00, 48.27s/speakers]
The dataset consists of 283 utterances, 70584 mel frames, 14084160 audio timesteps (0.24 hours).
Max input length (text chars): 226
Max mel frames length: 833
Max audio timesteps length: 166560
Embedding:   0%|                                                                       | 0/283 [00:00<?, ?utterances/s]Loaded encoder "pretrained.pt" trained to step 1594501
Embedding: 100%|█████████████████████████████████████████████████████████████| 283/283 [00:09<00:00, 29.04utterances/s]

H:\MockingBird>python synthesizer_train.py xiyuetest H:\制作数据集\SV2TTS\synthesizer
Arguments:
    run_id:          xiyuetest
    syn_dir:         H:\制作数据集\SV2TTS\synthesizer
    models_dir:      synthesizer/saved_models/
    save_every:      1000
    backup_every:    25000
    log_every:       200
    force_restart:   False
    hparams:

Checkpoint path: synthesizer\saved_models\xiyuetest\xiyuetest.pt
Loading training data from: H:\制作数据集\SV2TTS\synthesizer\train.txt
Using model: Tacotron
Using device: cpu

Initialising Tacotron Model...

Trainable Parameters: 32.869M

Loading weights at synthesizer\saved_models\xiyuetest\xiyuetest.pt
Tacotron weights loaded from step 75000
Using inputs from:
        H:\制作数据集\SV2TTS\synthesizer\train.txt
        H:\制作数据集\SV2TTS\synthesizer\mels
        H:\制作数据集\SV2TTS\synthesizer\embeds
Found 283 samples
+----------------+------------+---------------+------------------+
| Steps with r=2 | Batch Size | Learning Rate | Outputs/Step (r) |
+----------------+------------+---------------+------------------+
|   85k Steps    |     12     |     5e-06     |        2         |
+----------------+------------+---------------+------------------+

H:\MockingBird\synthesizer\synthesizer_dataset.py:84: UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at ..\torch\csrc\utils\tensor_new.cpp:248.)
  embeds = torch.tensor(embeds)
H:\MockingBird\synthesizer\synthesizer_dataset.py:84: UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at ..\torch\csrc\utils\tensor_new.cpp:248.)
  embeds = torch.tensor(embeds)
Traceback (most recent call last):
  File "H:\MockingBird\synthesizer_train.py", line 37, in <module>
    train(**vars(args))
  File "H:\MockingBird\synthesizer\train.py", line 208, in train
    optimizer.step()
  File "C:\Users\Administrator.DESKTOP-6GOULRD\AppData\Local\Programs\Python\Python310\lib\site-packages\torch\optim\optimizer.py", line 280, in wrapper
    out = func(*args, **kwargs)
  File "C:\Users\Administrator.DESKTOP-6GOULRD\AppData\Local\Programs\Python\Python310\lib\site-packages\torch\optim\optimizer.py", line 33, in _use_grad
    ret = func(self, *args, **kwargs)
  File "C:\Users\Administrator.DESKTOP-6GOULRD\AppData\Local\Programs\Python\Python310\lib\site-packages\torch\optim\adam.py", line 141, in step
    adam(
  File "C:\Users\Administrator.DESKTOP-6GOULRD\AppData\Local\Programs\Python\Python310\lib\site-packages\torch\optim\adam.py", line 281, in adam
    func(params,
  File "C:\Users\Administrator.DESKTOP-6GOULRD\AppData\Local\Programs\Python\Python310\lib\site-packages\torch\optim\adam.py", line 344, in _single_tensor_adam
    exp_avg.mul_(beta1).add_(grad, alpha=1 - beta1)
RuntimeError: The size of tensor a (1024) must match the size of tensor b (3) at non-singleton dimension 3

H:\MockingBird>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

8条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-05-19 10:55
关注
引用chatgpt部分指引作答：
根据你提供的信息，错误是在执行预处理脚本（pre.py）时出现的。错误信息表明在计算最大输入长度时出现了问题，因为max()函数的参数是一个空序列。

错误发生在preprocess.py文件的第88行，这是在计算文本的最大长度。根据代码，该错误是因为metadata列表为空导致的。metadata是从文件中读取的音频文件的元数据列表。

要解决这个问题，你可以检查以下几个方面：

1 确保你提供的音频文件路径（H:\制作数据集\aidatatang_200zh\corpus\train\xy）中的音频文件存在，并且文件名与transcript文件中的音频文件名一致。
2 确保你提供的文本文件路径（H:\制作数据集\aidatatang_200zh\transcript\aidatatang_200_zh_transcript.txt）中的文本文件存在，并且格式正确。
3 确保文本文件中的每一行都包含正确的格式，例如"文件名+空格+文本"。
4 检查aidatatang_200_zh_transcript.txt文件是否使用UTF-8编码保存。
如果仍然遇到问题，建议逐行调试代码并输出相关变量的值，以确定问题出现的具体位置和原因。这样有助于进一步排除问题并解决错误。

你可以把txt文档里的内容截图出来看看

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(7条)

报告相同问题？

关注问题

mockingbird:编程语言分类器
2021-05-18 08:30

语言学家可以通过以下方式用作Go软件包 import "github.com/lazywei/linguist" 并且在cli/ $ cd cli/$ ./build.sh$ ./mockingbird --help命令行界面用法准备LIBSVM格式数据集收集罗塞塔代码克隆 git clone git@...
MockingBird的模型。
2022-01-09 00:09

MockingBird的模型文件。放在MockingBird\synthesizer\saved_models\mandarin目录下
MockingBird实时语音克隆系统 v1.0.zip
2024-03-25 20:44

2. **模型训练**：MockingBird 可能使用了大量的人声样本进行训练，以学习和理解不同人的发音习惯和声音特性。训练过程可能涉及到深度学习框架，如 TensorFlow 或 PyTorch，以及大规模GPU集群以加速计算。 3. **...
MockingBird - 实时语音克隆中文/普通话
2024-08-04 13:43

E的工程笔记的博客一、关于 MockingBird 特性二、安装 1、通用配置 2、M1芯片Mac环境配置（Inference Time) 2.1 安装`PyQt5` 2.2 安装`pyworld`和`ctc-segmentation` 2.3 安装其他依赖 2.4 运行三、准备预训练模型 1、使用数据集...
基于MockingBird语音合成
2025-07-21 10:36

项目源码搭建介绍：《我的AI工具箱Tauri+Django开源git项目介绍和使用》https://datayang.blog.csdn.net/article/details/146156817 图形桌面工具使用教程：《我的AI工具箱Tauri+Django环境开发，支持局域网使用...
人工智能语音识别训练好的模型.rar
2020-04-22 13:59

在这个“人工智能语音识别训练好的模型.rar”压缩包中，包含的是一个已经经过大量数据训练优化的模型，可以用于实时或离线的语音识别任务。首先，我们要理解人工智能语音识别的基本工作原理。它通常分为以下几个...
train3_200k.pt
2021-10-16 13:19

MockingBird 预训练模型train3_200k.pt
MockingBird语音克隆运行流程[源码]
2025-11-20 03:24

接着下载预训练模型并放入指定目录，修改项目中的symbols.py文件。最后通过demo_toolbox.py或web.py运行项目，提供了GUI界面和web界面的具体操作步骤，包括音频上传、模型选择、合成导出等。文章还包含了音质优化...
在 Apple M1/M2 下安装训练 MockingBird
2023-09-18 13:41

Willin 老王躺平不摆烂的博客安装时选择仅为当前用户，否则会说版本不兼容不让安装。的时候找不到wheel，尝试从c里build时找不到。并看更新时间，找最新版本。下载解压后移动到 bin 目录。，让项目跑在x86架构环境上。因上述方法没有成功，选择...
MockingBird.zip
2025-10-20 13:16

MockingBird 是一个开源的 AI 语音克隆项目，能够在 5 秒内克隆用户的声音并生成任意语音内容。
Windows 10 python 3.9安装运行Mockingbird--拎包入住功略
2022-11-07 02:17

阆遤的博客 mockingbird拎包入住功略，是因为本人python不精通，机器学习等AI也只是只其然不知其所以然，没有调整算法和优化模型的能力，所以只能用牛人们创建好的代码使用，就象建好的房子我直接住一样:-)。
MockingBird模型压缩技术：在保持质量的同时减小模型体积
2025-09-13 02:49

巫清焘的博客以MockingBird为代表的现代语音合成系统通过深度学习技术实现了接近人类自然度的语音生成，但随之而来的是模型体积庞大、计算资源消耗高的问题。典型的MockingBird完整模型（包含编码器、合成器和Vocoder）通常需要...
MockingBird语音克隆系统 v1.0：实时语音合成实现方案
2025-11-29 17:21

该系统的设计理念是让机器能够理解和模仿人类的语音，通过预先训练好的模型进行数据处理，从而达到实时合成语音的目的。软件包中包含了多个脚本文件，每个脚本都有其特定的作用，共同协作完成整个语音克隆的流程。...
03.08：MockingBird项目
2023-03-08 22:02

TheYeah的博客 03.08：MockingBird项目
模型训练不收敛或模型过拟合解决方法
2022-08-06 20:49

lizi0403的博客模型训练不收敛或模型过拟合解决方法——非常有用的一些博客
MocikingBird已经训练好的数据集下载encode部分
2022-10-27 20:52

这些步骤是为了确保数据的一致性和模型的训练效率。例如，音频可能被转换为16kHz或22.05kHz的采样率，以减少数据大小而不牺牲太多质量。同时，背景噪声可能会通过降噪算法被移除，以提高模型对语音信号的专注度。 ...
Python语言的面向对象编程
2024-12-31 00:57

梁婉睛的博客 Python语言的面向对象编程在编程领域，面向对象编程（Object-Oriented Programming，OOP）是一种流行且强大的编程范式。Python作为一种多范式编程语言，充分支持面向对象编程。本文将深入探讨Python中的面向对象...
MockingBird:MockingBird是Fiddler扩展，用于将HTTP请求转换为另一种格式
2021-05-17 20:24

MockingBird是扩展，可将Fiddler的HTTP / HTTPs会话转换为您想要的任何其他格式，例如，您可以从要解决问题的选定请求中生成Java，C＃.net或任何其他语言代码，并在您的产品中使用输出代码最喜欢的IDE。它不仅限于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金100元 5月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月20日
展开全部

MockingBird社区分享的模型训练版本不一致

8条回答 默认 最新

问题事件

8条回答默认最新