个人数据集的声纹识别

问题描述

create_data.py文件中用的是zhvoice数据集，那么我们应该怎么修改程序才能识别我们自己的数据集呢？
或者说我们的数据集要怎么创建才能符合代码的要求？
以及数据集的语音数量是否有要求？

问题相关代码，请勿粘贴截图

def get_data_list(infodata_path, list_path, zhvoice_path):
with open(infodata_path, 'r', encoding='utf-8') as f:
lines = f.readlines()

f_train = open(os.path.join(list_path, 'train_list.txt'), 'w')
f_test = open(os.path.join(list_path, 'test_list.txt'), 'w')

sound_sum = 0
speakers = []
speakers_dict = {}
for line in tqdm(lines):
    line = json.loads(line.replace('\n', ''))
    duration_ms = line['duration_ms']
    if duration_ms < 1300:
        continue
    speaker = line['speaker']
    if speaker not in speakers:
        speakers_dict[speaker] = len(speakers)
        speakers.append(speaker)
    label = speakers_dict[speaker]
    sound_path = os.path.join(zhvoice_path, line['index'])
    save_path = "%s.wav" % sound_path[:-4]
    if not os.path.exists(save_path):
        try:
            wav = AudioSegment.from_mp3(sound_path)
            wav.export(save_path, format="wav")
            os.remove(sound_path)
        except Exception as e:
            print('数据出错：%s, 信息：%s' % (sound_path, e))
            continue
    if sound_sum % 200 == 0:
        f_test.write('%s\t%d\n' % (save_path.replace('\\', '/'), label))
    else:
        f_train.write('%s\t%d\n' % (save_path.replace('\\', '/'), label))
    sound_sum += 1

f_test.close()
f_train.close()

运行结果及报错内容

使用zhvoice数据包时，显示未找到文件
自己的数据集还不知道怎么使用

我的解答思路和尝试过的方法

将自己的数据集直接替换到zhvoice文件夹内

我想要达到的结果

能够用自己的数据集进行训练并识别自己的声音

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
夜雨飘零1 博客专家认证 2021-12-25 10:07
关注
应该是你没有解压数据导致找不到数据的。
你下载的这个数据只要全部解答里面的文件才行。
自己的数据集的话，按照那个数据列表的格式生成就好。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

语音压缩，声纹识别，先压缩后识别 python 有问必答自然语言处理
2021-04-15 08:47

回答 3 已采纳 f=wave.open(wavfile,'rb') 一般这种的read或者open中加个参数“b”就是转成字节流了，你可以试试wav.read(wavfile，“rb”)看看行不行
声纹识别，选择pytorch好还是kaldi？ c++ pytorch 开发语言
2021-11-08 14:54

回答 2 已采纳比较推荐pytorch，因为C++比较复杂,环境配置也容易出错，对研究生科研而言，python相对简单，；而且pytorch也可以调用kaldi pytorch-kald
我该如何看懂别人的网络模型人工智能有问必答深度学习神经网络
2021-05-30 23:03

回答 3 已采纳建议先学习一下相关数学知识，这样可以知道为什么要计算这个loss或这个acc为什么要这么算出来。至于说模型为什么起作用，主要还是要看对应的paper来了解当初最原始的基础结构是如何实现的。大部分的工作
基于深度学习实现的声纹识别项目python源码+声纹数据集+项目说明文档.zip
2023-03-06 15:34

基于深度学习实现的声纹识别项目python源码+语音语料数据集+项目说明文档首先是创建一个数据列表，数据列表的格式为<语音文件路径\t语音分类标签>，创建这个列表主要是方便之后的读取，也是方便读取使用其他的语音...
python声纹识别_声纹识别（说话人识别）
2020-12-08 11:04

weixin_39662611的博客声纹识别声纹识别，生物识别技术的一种，也称为说话人识别，有两类，即说话人辨认和说话人确认。声纹识别的理论基础是每一个声音都具有独特的特征，通过该特征能将不同人的声音进行有效的区分。声音特征1、语音的...
基于Keras+python实现的声纹识别系统完整源码(可训练和测试)+带数据集+训练好的模型+项目说明.7z
2022-12-14 15:31

基于Keras+python实现的声纹识别系统完整源码(可训练和测试)+带数据集+训练好的模型+项目说明.7z 【项目】基于深度学习的声纹识别【主要功能】通过声音识别人物实现原理（流程）：音频 → 提取语音特征（FFT...
Python实现说话人识别(声纹识别)算法
2023-09-07 08:44

shejizuopin的博客说话人识别，又称声纹识别。从上世纪60年代开始到现在，声纹识别一直是生物识别技术研究的主题。从传统的基于模板匹配的方法，到早期基于统计学方法，直到基于深度学习的声纹识别技术成为主流。本项目给出一个从传统...
基于Pytorch实现的声纹识别系统
2023-08-20 23:05

夜雨飘零1的博客本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型，不排除以后会支持更多模型，同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法，使用了ArcFace Loss，...
基于深度学习的声纹识别的Python源码+文档说明+数据集，包括GMM（已完成）、GMM-UBM、ivector、
2024-01-12 00:42

说话人识别，又称声纹识别。从上世纪60年代开始到现在，声纹识别一直是生物识别技术研究的主题。从传统的基于模板匹配的方法，到早期基于统计学方法，直到基于深度学习的声纹识别技术成为主流。本项目给出一个从传统...
基于Kersa实现的声纹识别项目源代码+使用说明，包括了自定义数据集的训练，声纹对比，和声纹识别
2023-08-25 12:58

本项目包括了自定义数据集的训练，声纹对比，和声纹识别。使用环境： Python 3.7 Tensorflow 2.3.0 安装环境 1、安装Tensorflow，这个包含GPU功能的。 pip install tensorflow==2.3.0 -i ...
分别基于深度学习GMM算法和self-attention算法实现的人说话声纹识别python源码+项目说明.zip
2023-12-15 17:45

分别基于深度学习GMM算法和self-attention算法实现的人说话声纹识别python源码+项目说明.zip 基于GMM的声纹识别 ### 1.1 测试环境： - 操作系统：Windows10 - 代码环境：Python3.6 - 主要用到的开源库：sklearn、...
基于深度学习实现的声纹识别项目python源码+项目说明文档.zip
2024-01-30 19:53

基于深度学习实现的声纹识别项目python源码+项目说明文档本教程笔者使用的是[中文语音语料数据集]，这个数据集一共有3242个人的语音数据，有1130000+条语音数据。如果读者有其他更好的数据集，可以混合在一起使用，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月24日

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog