Python edge-tts生成wav编码格式转换

使用edge_tts进行语音转换，保存的wav格式只有chunk['data'],虽然可以播放，但是不是标准的wave格式，尝试这转成wave格式确无法播放；
使用在线网站进行转换可以成功（单通道，双字节，44100Hz）,网站地址：

下面是我的python代码，以及转换前后的文件；

import asyncio
import struct
import edge_tts
import wave
from pydub import AudioSegment
import io

OUTPUT_FILE = "output.wav"
SAMPLE_RATE = 44100
CHANNELS = 1
SAMPLE_WIDTH = 2  # 16-bit audio
TEXT = "这里是语音流测试"
VOICE = "Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoNeural)"


# 根据实际需求进行采样和格式化处理的函数
def process_audio_data(audio_data):
    # 在这里进行采样和格式化处理，确保输出的数据符合 WAV 文件要求
    # 这可能包括改变采样率、通道数、采样精度等操作
    processed_data = audio_data
    return processed_data


async def _main() -> None:
    communicate = edge_tts.Communicate(TEXT, VOICE)
    # 创建 WAV 文件并写入音频数据
    with wave.open(OUTPUT_FILE, "wb") as wav_file:
        wav_file.setnchannels(CHANNELS)
        wav_file.setsampwidth(SAMPLE_WIDTH)
        wav_file.setframerate(SAMPLE_RATE)

        async for chunk in communicate.stream():
            if chunk["type"] == "audio":
                audio_data = chunk["data"]
                # 通过 BytesIO 将音频数据转换为文件对象
                audio_file = io.BytesIO(audio_data)
                # 使用 AudioSegment 加载音频文件
                audio_segment = AudioSegment.from_file(audio_file, format="raw", frame_rate=44100, channels=1,
                                                       sample_width=2)
                # 保存为 WAV 格式的文件
                output_file = "outputAudioSegment.wav"
                audio_segment.export(output_file, format="wav")
                # 采样和格式化处理
                processed_data = process_audio_data(audio_data)

                # 将处理后的音频数据写入 WAV 文件
                wav_file.writeframes(struct.pack("<" + ("h" * len(processed_data)), *processed_data))


if __name__ == "__main__":
    asyncio.run(_main())

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

edge-tts 文字转语音，python代码
2023-12-08 15:20

文字转语音python代码，可模拟不同人物声音，可存储声音文件.mp3格式,便于播放。代码简单，该库需要自行下载，使用该代码时，需要联网
【Python】edge-tts ：便捷语音合成
2025-01-09 19:18

T0uken的博客 `edge-tts` 是一个功能强大的 Python 库，利用 Microsoft Azure 的云端文本到语音（TTS）服务，支持多种语言和声音选项，能够生成高质量、自然听感的语音输出。它支持多种音频格式，包括 MP3、WAV 和 OGG，适用于在...
edge-tts音频格式转换：MP3到WAV、OGG等格式的批量处理
2025-08-29 10:38

陈革牧Perry的博客你是否在使用edge-tts生成语音时，发现只能输出MP3格式，而你的项目需要WAV、OGG等其他音频格式？本文将为你揭秘如何利用edge-tts结合音频处理工具，实现高效的批量格式转换解决方案。 ## edge-tts音频输出机制解析...
开源的 AI 文字转语音（TTS）工具edge-tts
2025-06-09 11:39

许于宝的博客的博客提供高质量的语音合成能力。，适用于多种应用场景，如。的 TTS 工具，适合。可使用 Web 界面。
edge-tts微软文本转语音库，来听听这些语音是否很熟悉？
2023-04-06 07:29

人工智能研究所的博客上期图文教程，我们分享了Azure机器学习的文本转语音的账号申请...我们的API也无法长期使用，好在微软发布了edge-tts库，此库继承了Azure的文本转语音功能，且是免费使用的，本期我们就介绍一下edge-tts的使用。
树莓派5+edge-tts 语音合成并进行播放测试
2025-04-28 10:42

小牛牛先生的博客 edge-tts 是一个功能强大的 Python 库，利用 Microsoft Azure 的云端文本到语音（TTS）服务，支持多种语言和声音选项，能够生成高质量、自然听感的语音输出。它支持多种音频格式，包括 MP3、WAV 和 OGG，适用于在...
edge-tts语音合成API：RESTful接口设计与OpenAPI文档
2025-08-29 10:35

虞旋律的博客 edge-tts是一个强大的Python库，它允许开发者通过Microsoft Edge的在线文本转语音服务生成高质量的语音内容，无需安装Microsoft Edge浏览器、Windows操作系统或API密钥。本文将深入探讨如何为edge-tts设计RESTful ...
Edge-TTS的语音合成如何实现个性化音色？
2025-10-28 17:42

2501_93878068的博客 python train.py --dataset ./your_voice_samples --model_name my_voice 音色混合技术混合多个Edge-TTS输出（如70%女声 + 30%男声）： from pydub import AudioSegment voice1 = AudioSegment.from_wav("voice1....
Python+edge-tts：微软文本转语音库的实战指南（场景+代码+流程图）
2025-09-28 08:40

小小测试开发的博客 edge-tts凭借高质量的语音合成、丰富的参数控制和极简的API设计，为Python开发者提供了快速实现文本转语音功能的解决方案。无论是个人项目（如有声书制作、无障碍工具）还是企业应用（如批量语音生成、智能客服），...
OpenAI-Edge-TTS：本地化 OpenAI 兼容的文本转语音 API，免费高效！
2025-01-23 14:40

AI云极的博客，一款基于 Microsoft Edge 在线文本转语音服务的开源项目，它提供了一个与 OpenAI API 兼容的本地 TTS 端点，让你能够通过简单的配置轻松实现文本到语音的转换，而且完全免费！文本转语音（TTS）技术已经成为人工...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月9日

Python edge-tts生成wav编码格式转换

0条回答 默认 最新

问题事件

0条回答默认最新