coze双向流式对话事件的增量语音处理

this.wsManager.sendAudioChunk(item.base64EncodedAudioDelta)发送完成音频后，为什么智能体解析音频的content是空

我的音频发送代码

// 上传音频到智能体
const base64Data = e.target.result.split(',')[1]; // 去掉 data:audio/mpeg;base64, 前缀
const binaryString = atob(base64Data); // Base64 转二进制字符串
console.log("转换后的 binaryString:",binaryString);
const arrayBuffer = new ArrayBuffer(binaryString.length);
console.log("转换后的 arrayBuffer:",arrayBuffer);
const uint8Array = new Uint8Array(arrayBuffer);
for (let i = 0; i < binaryString.length; i++) {
    uint8Array[i] = binaryString.charCodeAt(i);
}
const chunksData = this.chunkAndEncodeBase64(arrayBuffer)
console.log("转换后的 chunksData:",chunksData);
// 流式提交音频
for (let index = 0; index < chunksData.length; index++) {
    let item = chunksData[index];
    this.wsManager.sendAudioChunk(item.base64EncodedAudioDelta)
}
// 提交音频完成
this.wsManager.sendAudioComplete()

// 转base64EncodedAudioDelta
chunkAndEncodeBase64(arrayBuffer,CHUNK_SIZE=1024) {
    const chunks = [];
    let offset = 0;
    while (offset < arrayBuffer.byteLength) {
        const chunk = arrayBuffer.slice(offset, offset + this.CHUNK_SIZE);
        const base64 = this.arrayBufferToBase64(chunk);
        // console.log('base64--------------------',base64);
        chunks.push({
            base64EncodedAudioDelta: base64,
            index: offset / this.CHUNK_SIZE, // 分片序号（可选）
            isLast: offset + this.CHUNK_SIZE >= arrayBuffer.byteLength // 是否最后一片
        });
        offset += this.CHUNK_SIZE;
    }
    return chunks;
}

WebSocket.js配置

    // 初始化连接
    connect() {
        // 创建新连接（携带Token）
        this.socketTask = uni.connectSocket({
            url: this.url,
            header: {
                Authorization: `Bearer ${this.token}`
            }, // 关键：Header传Token
            success: () => console.log("WebSocket连接创建中..."),
            fail: err => console.error("连接创建失败:", err)
        });

        this.socketTask.onMessage(res => {
            this.handleMessage(res.data); // 消息处理
        });
    }
    // 发送音频配置（可选步骤）
    sendAudioConfig() {
        const config = {
            "id": "event_id",
            "event_type": "chat.update",
            "data": {
                "input_audio": { // 输入音频格式
                    "format": "pcm", // 输入音频格式，支持 pcm/wav/ogg。默认 wav
                    "codec": "pcm", // 输入音频编码。 pcm/opus。默认 pcm
                    "sample_rate": 24000, // 采样率
                    "channel": 1, // 通道数
                    "bit_depth": 16 // 位深
                },
                "output_audio": { // 输出音频格式
                    "codec": "pcm",
                    "pcm_config": {
                        "sample_rate": 16000, // 默认  24000
                        "frame_size_ms": 50,
                        "limit_config": {
                            "period": 1,
                            "max_frame_num": 22
                        }
                    },
                    "speech_rate": 0, // 回复的语速，取值范围 [-50, 100]，默认为 0，-50 表示 0.5 倍速，100 表示 2倍速
                    "voice_id": "7426720361733046281"
                }
            }
        }
        this.send(config);
    }
    // 发送音频分块数据
    sendAudioChunk(base64Data) {
        const event = {
            id: this.generateUUID(),
            event_type: "input_audio_buffer.append",
            data: {
                delta: base64Data
            }
        };
        // console.log('event=--------', base64Data);
        this.send(event);
    }
    // 标记音频输入完成
    sendAudioComplete() {
        const event = {
            id: this.generateUUID(),
            event_type: "input_audio_buffer.complete"
        };
        this.send(JSON.stringify(event));
    }
    // 发送消息
    send(data) {
        if (!this.isConnected) {
            console.warn("连接未就绪，消息丢弃");
            return;
        }
        const payload = typeof data === 'string' ? data : JSON.stringify(data);
        this.socketTask.send({
            data: payload
        });
    }
      // 接收消息
    handleMessage(data) {
        try {
            const msg = JSON.parse(data);
            console.log('获取消息msg', msg);
            // 处理服务端返回的各种事件
            switch (msg.event_type) {
                ...
            }
        } catch (e) {
            console.error("消息处理失败", e);
        }
    }

chunksData打印为

智能体返回的消息

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-07-01 16:25
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解答

你遇到的问题是，发送完成音频后，智能体解析音频的content是空。这个问题可能是由于音频数据的处理方式或发送方式导致的。

首先，需要检查音频数据是否正确地被发送出去。可以通过检查网络请求是否成功、音频数据是否正确地被base64编码等方式来验证。

其次，需要检查智能体是否正确地解析音频数据。可以通过检查智能体的音频处理逻辑、是否正确地解析音频头信息等方式来验证。

如果以上步骤都没有问题，那么可能是由于音频数据的处理方式或发送方式导致的。可以尝试以下解决方案：

检查音频数据是否被正确地base64编码。如果不是，可以尝试使用其他base64编码库或方式来编码音频数据。
检查智能体是否正确地解析音频数据。如果不是，可以尝试使用其他音频解析库或方式来解析音频数据。
检查音频数据是否被正确地发送出去。如果不是，可以尝试使用其他网络请求库或方式来发送音频数据。

以下是一个简单的示例代码，用于发送音频数据：

// 发送音频数据 this.wsManager.sendAudioChunk(item.base64EncodedAudioDelta); // 解析音频数据 const audioData = atob(item.base64EncodedAudioDelta); const audioBuffer = new AudioBuffer(audioData);

这个示例代码使用了Web Audio API来解析音频数据。如果你使用的是其他音频处理库，可以根据库的文档来实现音频数据的解析。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

coze双向流式对话事件的增量语音处理，如何实现？
2025-07-05 22:23

bug菌¹的博客 // 处理服务端返回的各种事件 switch (msg.event_type) { ... } } catch (e) { console.error("消息处理失败", e); } } chunksData打印为：智能体返回的消息：请知悉：如下方案不保证一定适配你的问题！如下...
AI编程平台Coze中自然语言编程与工作流应用
2025-09-28 12:42

内容概要：本文介绍了字节跳动推出的AI Bot开发平台“扣子（Coze）”，提出了一种基于“自然语言编程”和“配置即开发”的全新编程范式。通过自然语言描述功能需求、可视化工作流搭建逻辑、结合插件与知识库集成外部...
【AI编程与智能应用开发】基于扣子平台COZE的编程学习助手智能体构建与实战案例分析
2025-08-06 20:50

②构建具备自然语言处理能力的编程学习助手，提高编程学习效率；③通过集成 GitHub 插件，查询和推荐开源项目资源；④实现智能体的多平台部署，扩大应用范围。; 其他说明：Coze 平台不仅适用于个人开发者进行实验性...
SpringBoot CozeAI流式对话实战[可运行源码]
2025-11-13 07:04

在处理流式对话的增量消息、缓冲机制以及错误处理方面，文章同样提供了相应的解决方案。增量消息保证了对话状态的连续性和完整性，缓冲机制则能有效管理内存使用和数据流的平滑传输，而错误处理则确保了通信过程中的...
Coze API流式响应实现[可运行源码]
2025-11-16 07:40

本文详细介绍了一种名为Coze API的流式响应实现，这一实现允许开发者以流的形式处理来自服务器的数据。在流式响应中，服务器不再是等待客户端请求后再发送一个完整的响应，而是能够实时地将数据推送到客户端，这对于...
【人工智能编程辅助工具】扣子COZE全流程解析：提升编程效率与代码质量的智能开发系统扣子COZE
2025-08-04 21:39

使用场景及目标：①通过自然语言描述快速生成代码片段，适用于多种编程语言；②在编写代码过程中获得智能补全和优化建议，减少人为错误；③利用调试辅助功能快速定位和解决代码问题，缩短调试周期；④通过学习指导...
Coze智能体对话页面搭建[可运行源码]
2025-11-23 09:43

本文详细介绍了如何利用一套前端方案快速搭建Coze智能体对话页面，并提供完整的可运行源码。这套方案基于HTML代码构建，它不仅能实现流式输出，还能支持图片直显功能，从而极大地提高了开发效率。 Coze智能体对话...
【人工智能编程辅助】扣子COZE智能编程工具全流程解析：提升开发效率与代码质量的应用实践扣子COZE
2025-08-04 21:42

扣子COZE通过深度学习和自然语言处理技术，实现了代码自动生成、智能补全、错误检测与优化建议等功能，适用于多种编程语言和开发场景。其核心功能包括：利用自然语言理解技术实现从自然语言描述到代码生成的转换，...
【人工智能客服】基于扣子COZE平台的多轮对话智能客服助手开发：企业官网客户服务自动化实现
2025-07-29 21:31

内容概要：文章介绍了如何在COZE（扣子）平台上开发一个多轮对话智能客服助手，以实现用户问题自动应答、服务推荐与信息查询等功能。COZE平台作为多模态智能体开发平台，提供了低门槛、高灵活度的智能对话系统构建...
扣子COZE AI 编程案例
2025-09-25 17:00

此外，还介绍了自动化办公助手的功能，通过COZE的API集成能力连接企业微信/钉钉，实现会议纪要生成、日程提醒等功能，涵盖了OCR识别与自然语言处理的混合工作流设计。在生产力工具技巧部分，介绍了快捷键组合的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月1日

coze双向流式对话事件的增量语音处理

6条回答 默认 最新

解答

问题事件

6条回答默认最新