• 全部
  • 关注
  • 有问必答
  • 等你来答

排行榜

  • 用户榜
  • 标签榜
  • 冲榜分奖金

频道

  • 编程语言
  • 后端
  • Python
  • Java
  • 前端
最新最热精华悬赏待回答 筛选
  • 1

    回答

问题遇到的现象和发生背景 问题相关代码,请勿粘贴截图 运行结果及报错内容 我的解答思路和尝试过的方法 我想要达到的结果

回答 y3285779
采纳率0%
  • 0

    回答

问题自带的语音效果不好,API接口不想用,有没有其他的办法来解决语音识别问题

  • 0

    回答

求音频dl~Buffer Length是做什么的?设置的长一点好还是短点好?分别有什么(过长或者过短)缺陷?

  • 1

    回答

Android原生开发的app,功能是定时调接口返回文本信息,后将文本信息显示到页面并且转成语音播报出来。安装的安卓大屏设备版本是8.1,文本信息可以正常显示,但是语音播报不了。在手机上(Androi

  • 1

    回答

想提取视频字幕,视频本身带有字幕,视频是mp4格式,是硬字幕。不要语音识别类的,错误率太高。 尝试一次次截图,再用识图软件识别。累死。也不要边看边识别的那种图片式提取。 有没有人知道解决办法或者软件。

  • 1

    回答

问题描述 create_data.py文件中用的是zhvoice数据集,那么我们应该怎么修改程序才能识别我们自己的数据集呢?或者说我们的数据集要怎么创建才能符合代码的要求?以及数据集的语音数量是否有要

  • 2

    回答

问题遇到的现象和发生背景 问题相关代码,请勿粘贴截图 运行结果及报错内容 我的解答思路和尝试过的方法 我想要达到的结果

回答 lanther
采纳率0%
  • 0

    回答

公司项目需要通过服务端和客户端来达到实时语音传输的目的,目前我测试了音频文件是可以的

  • 1

语音处理方向,涉及的人越来越少了吗?学的人工智能,从事人工智能方向工作,偶尔接触语音处理方面知识,但是每次遇到一些难点,就求助无门,身边的人都很少有人会这些,不知道是不是语音处理这个方向已经发展的比较

liujuan1208
采纳率100%
  • 1

    回答

写出一帧N个样点的短时平均能量、短时平均幅度、短时平均过零率、短时自相关函数、短时平均幅度差函数的matlab计算函数编程代码。

qq_45425261
采纳率0%
  • 1

    回答

语音识别,用CTC作为损失函数,准确率一直为0,对模型输出结果解码,全为0(空白标签),是怎么回事?该怎么解决?期待您的回答,谢谢!

  • 1

    回答

from matplotlib import pyplotimport thinkdsp wave=thinkdsp.read_wave("Oldboy.wav")wave.plot()pyplot.

weixin_42475241
采纳率50%
  • 2

在linux环境中调用科大讯飞SDK,与ROS 相结合实现语音控制.APPID对应的就是我申请的SDK包catkin_make没有出现任何错误,但是在进行语音识别时却出现了用户校验失败错误: qrx@

秦哈哈
采纳率50%
  • 1

    回答

//语音识别 public void voiceRecognition() { //创建一个AsrClient对象 AsrClient asrClient =

回答 Jia_feiyang
采纳率0%
  • 1

    回答

求问大佬们,IIR/FIR滤波器和切比雪夫/巴特沃兹滤波器到底什么关系啊,后悔大学专业课都用来睡觉了,唉😮‍💨

回答 Silence1106
采纳率0%
  • 1

    回答

最近在做语音识别的项目,使用场景是一个人会时不时的说话,希望把它说话的部分直接录音下来。求各位提供点建议

回答 saxion22
采纳率0%
  • 1

    回答

Traceback (most recent call last): File "/media/speechlab/data/openasr/egs/aishell2/s5/../../../src

回答 郑郑yay
采纳率0%
  • 1

function txt = Voice2Txt(Time,varargin) %语音 短语音识别 Fs =16000; nBits = 16 ; nChannels = 2 ; switch

Long,,
采纳率100%
  • 1

代码:Fs =16000;nBits = 16 ;nChannels = 2 ;switch nargin case 1recObj = audiorecorder(Fs,nBits,nChan

Long,,
采纳率100%
  • 1

我想在Android上实现语音识别,现在已经有模型了,但是不知道如何在Android上对音频做预处理,就是快速傅里叶变换。Python上可以使用librosa对音频预处理,但是Android没有相关工

夜雨飘零1
采纳率100%
  • 1

    回答

第一次运行的时候没问题,第二次运行就报错,如图所示,这里直接运行的mfcc的官方说明文档中的例子

回答 qq_45719733
采纳率0%
  • 1

    回答

系统win10,python,pytorch首先,录音是通过pyaudio,然后用wave保存成本地*.wav文件,然后,分类模型每次是通过speech_array, _sampling_rate =

He.ColdThinking
采纳率0%
  • 1

    回答

手里有一个音频识别的项目,先把.wav音频文件放进matlab进行预处理,然后得到.mat再放到python的网络里学习。现在和别人对接,需要给人家一个接口(http请求),请问这个该怎么做

回答 curitis_liu
采纳率0%
  • 1

    回答

为啥只有python程序结束再开pyaudio中的get_device_count才可以重新获取音频设备的数量,而当程序运行时插入一个麦克风,这个方法却检测不到刚插入的设备,什么方法能在程序运行时实时

回答 qq_53217421
采纳率50%
  • 1

我现在想做一个类似于ktv评分的系统,想要购买一个可以评分的接口服务,我的系统输入音频给接口,接口将输入音频和事先准备好的标准音频做对比,输出评分结果。评分的模型最好可以根据需要调整。请问有没有类似的

魔魔芈
采纳率100%
  • 2

用load_dataset下载数据集,出现这个错误,请问有人知道原因么?应该怎么解决了,换了dataset的版本也不行。Couldn't reach h

Amireus
采纳率100%
  • 1

    回答

目前百度和科大讯飞的语音识别ASR 主要支持 pcm实时音频流,但不支持aac实时音频流。 但在IOS系统微信小程序上 录音仅支持 aac实时音频流,不支持pcm实时音频流么?如果支持要怎么设置? 注

xiaoruan123
采纳率0%
  • 1

    回答

有没有汽车共享系统,新能源汽车,需要App的手机和安卓系统,后台管理,硬件开发

  • 0

    回答

设计智能语音玩具,有声传感器、震动传感器,有什么新奇的玩法吗?