使用科大讯飞语音转写功能，实现长语音识别

我在使用科大讯飞的语音转写的时候，对长语音进行转文本的时候，返回下面的结果集。

返回的类型为str，我想获取返回值里面的识别内容，也就是onebest关键字里面的内容，但是我不知道怎么获取。


# -*- coding: utf-8 -*-
# 
#   author: yanmeng2
# 
# 非实时转写调用demo
# 目前语音转写支持的音频格式为：已录制音频（5小时内），wav,flac,opus,m4a,mp3，
# 单声道&多声道，支持语种：中文普通话、英语、开通的小语种以及中文方言，采样率：8KHz,16KHz

import base64
import hashlib
import hmac
import json
import os
import time

import requests

lfasr_host = 'http://raasr.xfyun.cn/api'

# 请求的接口名
api_prepare = '/prepare'
api_upload = '/upload'
api_merge = '/merge'
api_get_progress = '/getProgress'
api_get_result = '/getResult'
# 文件分片大小10M
file_piece_sice = 10485760

# ——————————————————转写可配置参数————————————————
# 参数可在官网界面（https://doc.xfyun.cn/rest_api/%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99.html）查看，根据需求可自行在gene_params方法里添加修改
# 转写类型
lfasr_type = 0
# 是否开启分词
has_participle = 'false'
has_seperate = 'true'
# 多候选词个数
max_alternatives = 0
# 子用户标识
suid = ''


class SliceIdGenerator:
    """slice id生成器"""

    def __init__(self):
        self.__ch = 'aaaaaaaaa`'

    def getNextSliceId(self):
        ch = self.__ch
        j = len(ch) - 1
        while j >= 0:
            cj = ch[j]
            if cj != 'z':
                ch = ch[:j] + chr(ord(cj) + 1) + ch[j + 1:]
                break
            else:
                ch = ch[:j] + 'a' + ch[j + 1:]
                j = j - 1
        self.__ch = ch
        return self.__ch


class RequestApi(object):
    def __init__(self, appid, secret_key, upload_file_path):
        self.appid = appid
        self.secret_key = secret_key
        self.upload_file_path = upload_file_path

    # 根据不同的apiname生成不同的参数,本示例中未使用全部参数您可在官网(https://doc.xfyun.cn/rest_api/%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99.html)查看后选择适合业务场景的进行更换
    def gene_params(self, apiname, taskid=None, slice_id=None):
        appid = self.appid
        secret_key = self.secret_key
        upload_file_path = self.upload_file_path
        ts = str(int(time.time()))
        m2 = hashlib.md5()
        m2.update((appid + ts).encode('utf-8'))
        md5 = m2.hexdigest()
        md5 = bytes(md5, encoding='utf-8')
        # 以secret_key为key, 上面的md5为msg， 使用hashlib.sha1加密结果为signa
        signa = hmac.new(secret_key.encode('utf-8'), md5, hashlib.sha1).digest()
        signa = base64.b64encode(signa)
        signa = str(signa, 'utf-8')
        file_len = os.path.getsize(upload_file_path)
        file_name = os.path.basename(upload_file_path)
        param_dict = {}

        if apiname == api_prepare:
            # slice_num是指分片数量，如果您使用的音频都是较短音频也可以不分片，直接将slice_num指定为1即可
            slice_num = int(file_len / file_piece_sice) + (0 if (file_len % file_piece_sice == 0) else 1)
            param_dict['app_id'] = appid
            param_dict['signa'] = signa
            param_dict['ts'] = ts
            param_dict['file_len'] = str(file_len)
            param_dict['file_name'] = file_name
            param_dict['slice_num'] = str(slice_num)
        elif apiname == api_upload:
            param_dict['app_id'] = appid
            param_dict['signa'] = signa
            param_dict['ts'] = ts
            param_dict['task_id'] = taskid
            param_dict['slice_id'] = slice_id
        elif apiname == api_merge:
            param_dict['app_id'] = appid
            param_dict['signa'] = signa
            param_dict['ts'] = ts
            param_dict['task_id'] = taskid
            param_dict['file_name'] = file_name
        elif apiname == api_get_progress or apiname == api_get_result:
            param_dict['app_id'] = appid
            param_dict['signa'] = signa
            param_dict['ts'] = ts
            param_dict['task_id'] = taskid
        return param_dict

    # 请求和结果解析，结果中各个字段的含义可参考：https://doc.xfyun.cn/rest_api/%E8%AF%AD%E9%9F%B3%E8%BD%AC%E5%86%99.html
    def gene_request(self, apiname, data, files=None, headers=None):
        response = requests.post(lfasr_host + apiname, data=data, files=files, headers=headers)
        result = json.loads(response.text)
        if result["ok"] == 0:
            print("{} success:".format(apiname) + str(result))
            return result
        else:
            print("{} error:".format(apiname) + str(result))
            exit(0)
            return result

    # 预处理
    def prepare_request(self):
        return self.gene_request(apiname=api_prepare,
                                 data=self.gene_params(api_prepare))

    # 上传
    def upload_request(self, taskid, upload_file_path):
        file_object = open(upload_file_path, 'rb')
        try:
            index = 1
            sig = SliceIdGenerator()
            while True:
                content = file_object.read(file_piece_sice)
                if not content or len(content) == 0:
                    break
                files = {
                    "filename": self.gene_params(api_upload).get("slice_id"),
                    "content": content
                }
                response = self.gene_request(api_upload,
                                             data=self.gene_params(api_upload, taskid=taskid,
                                                                   slice_id=sig.getNextSliceId()),
                                             files=files)
                if response.get('ok') != 0:
                    # 上传分片失败
                    print('upload slice fail, response: ' + str(response))
                    return False
                print('upload slice ' + str(index) + ' success')
                index += 1
        finally:
            'file index:' + str(file_object.tell())
            file_object.close()
        return True

    # 合并
    def merge_request(self, taskid):
        return self.gene_request(api_merge, data=self.gene_params(api_merge, taskid=taskid))

    # 获取进度
    def get_progress_request(self, taskid):
        return self.gene_request(api_get_progress, data=self.gene_params(api_get_progress, taskid=taskid))

    # 获取结果
    def get_result_request(self, taskid):
        return self.gene_request(api_get_result, data=self.gene_params(api_get_result, taskid=taskid))

    def all_api_request(self):
        # 1. 预处理
        pre_result = self.prepare_request()
        taskid = pre_result["data"]
        # 2 . 分片上传
        self.upload_request(taskid=taskid, upload_file_path=self.upload_file_path)
        # 3 . 文件合并
        self.merge_request(taskid=taskid)
        # 4 . 获取任务进度
        while True:
            # 每隔20秒获取一次任务进度
            progress = self.get_progress_request(taskid)
            progress_dic = progress
            if progress_dic['err_no'] != 0 and progress_dic['err_no'] != 26605:
                print('task error: ' + progress_dic['failed'])
                return
            else:
                data = progress_dic['data']
                task_status = json.loads(data)
                if task_status['status'] == 9:
                    print('task ' + taskid + ' finished')
                    break
                print('The task ' + taskid + ' is in processing, task status: ' + str(data))

            # 每次获取进度间隔20S
            time.sleep(20)
        # 5 . 获取结果
        return self.get_result_request(taskid=taskid)


# 注意：如果出现requests模块报错："NoneType" object has no attribute 'read', 请尝试将requests模块更新到2.20.0或以上版本(本demo测试版本为2.20.0)
# 输入讯飞开放平台的appid，secret_key和待转写的文件路径
if __name__ == '__main__':
    api = RequestApi(appid="da63660e", secret_key="0be1fc696abc498b5188efda9cdf420b", upload_file_path=r"H:\universe.mp3")
    result = api.all_api_request()
    print('\n\n')
    print(result)
    # print('\n\n')
    # print(type(result['data']))  # <class str>
    # part = ''
    # for content in result['data']:
    #     part += str(content['onebest'])
    # print(part)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

讯飞实时语音转写,获取音频文件问题? java 有问必答
2021-09-16 22:23

回答 3 已采纳文件要先写入，才能读取这个路径下的资源。
讯飞实时语音转写，获取的路径报错找不到上传的音频文件 java 有问必答
2021-09-13 08:42

回答 5 已采纳使用随机读取流的时候，改为可读可写模式。
Java讯飞实时语音转写找不到路径错误 java 有问必答
2021-09-15 07:52

回答 1 已采纳查一下是否有那个路径，上传应该获取指定目录路径，而不是拿待上传文件去获取。
AI语音科大讯飞智能api【web端接口调用实现语音识别】webscoket调试试用
2023-11-07 14:16

使用web形式实现语音识别
请教各路高手：能对英文音频，像ARCTIME这样，实现自动打轴功能的语音识别软件，目前都有哪些？自然语言处理
2019-06-28 12:32

回答 3 已采纳谢谢楼上告知的Nuance！我查了一下午，找到了不少。罗列一下，也许后面也会有人需要。网站有讯飞、百度、Amazon Transcribe、谷歌、有道、网易见外、IBM等。软件还有Camt
c++怎样转写c语言 c++ c语言
2022-09-03 22:13

回答 2 已采纳 LC.elem = (ElemType*) malloc(LC.length * sizeof(struct ElemType));
Java如何实现将音频文件转换为字节数组 java spring 开发语言
2021-10-25 22:07

回答 1 已采纳可以看下base64
科大讯飞语音转写API接口申请
2023-12-18 16:27

本尊是喵的博客 科大讯飞语音转写API接口申请和使用
java中如何结束线程，结束这个函数 java python
2021-11-02 09:40

回答 3 已采纳 System.exit(你要返回的值);
Java中如何得到多个返回值 java python
2021-11-02 09:31

回答 4 已采纳很简单啊，写一个类，把这两个放进去就行了。不想写类就用个什么数组、集合、map之类的都行
python批量发送get请求获取api返回数据后写入excel问题 python
2022-09-26 23:59

回答 1 已采纳导出到excel和转换成html用pandas几行代码就可以了 data = [{'taskId': 1, 'data_amount': 0}, {'taskI
科大讯飞语音转写
2023-11-03 14:32

黛安娜的新月之刃的博客 科大讯飞语音转文字，java SDK 和 webAPI 两种方式
大神帮看一下我的这段代码如何更改才可改到正确答案 c语言
2020-01-12 00:26

回答 2 已采纳 k这个变量没有看到有什么用 if(i==2) sum+=28; 这里是否要判断闰年？你题目的地址给我，可以帮你测试下
科大讯飞语音转写以及语音合成配置+遇到问题处理
2021-10-21 16:42

TTOM猫的博客提示：文章写完后，目录可以自动生成，如何生成可参考右边...此为VUE配置科大讯飞语音转写功能一、功能配置 1.引入官方demo中的js IatRecorder.js： import CryptoJS from 'crypto-js' import Worker from './transc
Unity对接科大讯飞实时语音转写WebAPI（Windows平台）(二)
2024-05-24 10:39

cheng219101的博客上一篇中，用到的是MicPhone类，然后遗留问题是yield return new WaitForSecondsRealtime(0.04f)导致消息发送得很慢，语音识别不及时。BufferMilliseconds我这里设置的80，数据长度会大于1280，讯飞也是可以完成识别...
Android集成科大讯飞语音识别、语音唤醒、语音播报简易封装
2023-12-06 14:28

人民的石头的博客注意其实代码还可以优化，由于公司业务需要，封装的不怎么彻底，使用者可在此基础上进一步封装。其中IflytekAPP_id为科大讯飞平台的应用id。到此语音唤醒已经集成结束，接下来是语音识别。
Java实现实时语音转写（科大讯飞API）-另附Python实现视频教程
2024-03-22 09:48

Bug缔造者的博客然后进入该应用中，选择左侧实时语音转写，可以看到自己的APPID和APIKey，后续代码中使用。说明：通过麦克风将语音流通过websocket发送解析。3、将demo文件导入IDEA中。设置音频属性，将音频流发送。
Android 科大讯飞语音识别(详细步骤+源码)
2024-05-03 06:40

2401_84010457的博客 i++) { // 转写结果词，默认使用第一个结果 JSONArray items = words.getJSONObject(i).getJSONArray(“cw”); JSONObject obj = items.getJSONObject(0); ret.append(obj.getString(“w”)); // 如果需要多候选...
在树莓派中写入科大讯飞语音转文字识别程序
2022-05-08 10:11

萧鼎的博客在树莓派桌面里新建一个xunfei_zhuan.py文件，然后打开文件，然后使用默认软件编程点击terminal，在里面使用以下命令安装cffi==1.12.3库 pip3 install cffi==1.12.3 使用以下命令安装gevent==1.4.0库 pip3 ...
Unity 接入科大讯飞语音识别及语音合成
2020-07-29 15:38

CoderZ1010的博客首先需要到科大讯飞官网开发者控制台创建一个应用，创建成功后获得服务接口认证信息，我们只需用到其中的AppID。其次需要下载自己的SDK，一些小伙伴非常擅长在网上找资源，把别人的拿过来，然后发现调用不起来，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月27日

悬赏问题

¥30 为什么会失败呢，该如何调整
¥50 如何在不能联网影子模式下的电脑解决usb锁
¥20 服务器redhat5.8网络问题
¥15 如何利用c++ MFC绘制复杂网络多层图
¥20 要做柴油机燃烧室优化需要保持压缩比不变请问怎么用AVL fire ESE软件里面的 compensation volume 来使用补偿体积来保持压缩比不变
¥15 python螺旋图像
¥15 算能的sail库的运用
¥15 'Content-Type': 'application/x-www-form-urlencoded' 请教这种post请求参数，该如何填写？？重点是下面那个冒号啊
¥15 找代写python里的jango设计在线书店
¥15 请教如何关于Msg文件解析

使用科大讯飞语音转写功能，实现长语音识别

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新