MoonShot API调用Token计算计费

问题遇到的现象和发生背景

该问题关于MoonShot API 调用过程中Token计算计费。

本人由于学习需要，使用Python通过OpenAI库中client.chat.completions.create（）方法多次调用MoonShotAPI，并使用Print（）打印获得的调用结果，其中打印的结果会包含“total_tokens”数据，如下图所示:

通过把打印获得的调用结果和MoonShot用户中心“计费明细”模块中“账单详情”中“消耗（Token）”对比，发现MoonShot用户中心“计费明细”模块中“账单详情”中“消耗（Token）”中Token多余实际调用答应出来的“total_tokens”。如下图所示：

图中画红圈的行是在调用时命令行没有打印出现过的消耗，所以想请问有人知道为什么会有这样的额外消耗吗?因为每一次消耗Token都是计费的。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

码农阿豪@新空间新星创作者: 前端开发技术领域 2024-03-22 16:59

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

针对该问题，可能存在以下原因：

请求失败/retry导致的多余Token消耗。在每一次请求失败后，服务端都会将该请求消耗的Token计入用户账号的消耗，而如果客户端在请求失败后未作重试处理，则该Token会被多次计入消耗明细中。
非API调用导致的Token消耗。除API调用以外，MoonShot内建了许多其他功能，如数据准备、分析等，也会消耗Token计费。针对第1种情况，建议在请求失败时，先将该token进行缓存，并在重试时重新使用该缓存的token进行请求，避免多次消耗。示例代码：

import openai_secret_manager
import openai
import time
api_key = openai_secret_manager.get_secret("openai")["api_key"]
model_engine = "text-davinci-002"
openai.api_key = api_key
def generate_text(prompt):
    try:
        response = openai.Completion.create(
            engine=model_engine,
            prompt=prompt,
            max_tokens=1024,
            n=1,
            stop=None,
            temperature=0.5,
            frequency_penalty=0,
            presence_penalty=0
        )
        if 'choices' in response:
            return response['choices'][0]['text']
        else:
            print('there is no choices in the response')
            return ''
    except Exception as e:
        print('generate_text_api_error:', e)
        return ''
cached_token = ''
def generate_text_with_retry(prompt, retry_num=2):
    global cached_token
    for i in range(retry_num):
        try:
            # 判断是否需要重新使用缓存的token
            if cached_token:
                response = openai.Completion.create(
                    engine=model_engine,
                    prompt=prompt,
                    max_tokens=1024,
                    n=1,
                    stop=None,
                    temperature=0.5,
                    frequency_penalty=0,
                    presence_penalty=0,
                    access_token=cached_token
                )
            else:
                response = openai.Completion.create(
                    engine=model_engine,
                    prompt=prompt,
                    max_tokens=1024,
                    n=1,
                    stop=None,
                    temperature=0.5,
                    frequency_penalty=0,
                    presence_penalty=0
                )
            # 是否需要缓存token
            if 'access_token' in response:
                cached_token = response['choices'][0]['access_token']
            if 'choices' in response:
                return response['choices'][0]['text']
            else:
                print('there is no choices in the response')
                return ''
        except Exception as e:
            print('generate_text_api_error:', e)
            time.sleep(3)
            continue
    return ''

针对第2种情况，建议通过MoonShot用户中心的“计费明细”模块中的“消耗(Token)”详情，查看非API调用部分所消耗的Token数量，从而进一步优化代码，减少非API调用的消耗。

报告相同问题？

关注问题

Dify调用Moonshot模型API的方法总结
2025-12-25 06:29

jie sherry的博客通过Dify低代码平台调用Moonshot大模型API，实现高效AI应用开发。结合可视化工作流与国产长上下文模型，支持RAG、安全配置与多环境部署，显著降低开发成本，提升中文场景下的响应质量与系统稳定性。
使用 Dify 和 MoonShot API 做一个懒人 AI 阅读工具（二）：轻量 RAG 应用
2024-04-25 21:34

soulteary的博客这篇文章，我们继续聊聊，如何折腾 AI 应用，把不 AI 的东西，“AI 起来”。在不折腾复杂的检索系统的前提下，做一些轻量的 RAG 实践。
一文搞懂 AI 大模型 API 的 Token 计费机制
2026-03-26 10:05

TheRouter的博客本文解析了大模型API的Token计费机制与实用省钱技巧。Token是文本处理的最小单位，中英文Token密度差异显著（中文约为英文2倍）。计费按输入/输出Token分开计算，输出通常更贵。文章对比了主流国产模型定价，指出...
Moonshot.Ai（月之暗面Ai模型）
2025-02-05 16:33

The丶Star的博客例如，你可能向 ChatCompletions 发送了 20 个请求，每个请求只有 100 个 Token ，那么你就达到了限制（如果你的 RPM 限制是 20），即使你在这些 20 个请求中没有发满 200k 个 Token （假设你的TPM限制是 200k）。...
Moonshot AI价格全解析：如何用15元免费额度玩转Kimi大模型（附成本计算器）
2025-08-15 08:07

杠精协会主席的博客本文详细解析了Moonshot AI（Kimi大模型）的API计费模型，并指导开发者如何充分利用15元免费额度。通过实战案例，如构建代码审查助手和长文档摘要工具，演示了如何根据任务特性选择不同模型以优化成本，并提供了成本...
Dify支持的主流大模型列表及Token调用配置指南
2025-12-26 01:07

序雨的博客 Dify通过可视化编排和统一接口，简化了主流大模型的集成流程，支持OpenAI、通义千问、百川、GLM等国内外模型，并实现精准Token预估与成本控制。其分层架构确保多模型切换灵活，具备A/B测试、自动降级、热更新等实用...
Moonshot AI成本控制手册：如何用moonshot-v1-8k模型省下80%的API调用费用？
2026-03-07 02:13

执笔画书生的博客本文详细解析了如何通过精准的API成本控制策略，在使用Moonshot AI的moonshot-v1-8k模型时实现高达80%的费用节省。文章从理解Token计费机制入手，深入探讨了模型选择、Token预测监控、Prompt工程优化及系统架构设计...
月之暗面的野心全在“长上下文”里：moonshot kimi api key获取以及解构Kimi K2深度指南
2025-07-18 18:15

技术程序猿华锋的博客但我们不只看代码和参数，我更想带你看看，这家被资本捧上“AI 猛虎”宝座的公司，是如何把创始人的学术理想，一步步变成一个让所有开发者都能触碰的、强大的 AI 工具。资本的疯狂追捧，像一张VIP门票，让月之暗面在...
大模型Token计费揭秘：如何避免花冤枉钱，高效使用AI工具？
2026-03-21 21:04

程序员辣条的博客大模型Token计费机制解析：从对话本质到省钱技巧本文系统解析了大模型Token计费机制，揭示了对话本质是单向请求-响应过程，Token作为语言积木处理文本，中文Token消耗显著高于英文。文章详细阐述了上下文窗口的容量...
Langchain与Kimi AI（Moonshot AI）集成实战：从API调用到项目部署
2026-03-09 00:31

爱摄影的郭同学的博客从获取API Key、配置开发环境，到使用原生OpenAI SDK和Langchain社区包两种方式调用Kimi AI，并构建了可维护的项目结构。文章进一步展示了如何利用Langchain的Chain和SequentialChain进行任务编排，最后提供了通过...
大模型API调用实战：从URL解析到多平台集成（Kimi、Qwen、DeepSeek）
2025-10-03 03:33

五行擒拿术的博客本文详细解析了大模型API调用的核心概念，重点阐述了api_base与完整端点的区别，并通过实战代码演示了如何正确调用Kimi、Qwen和DeepSeek等主流大模型的API。文章还提供了在VS Code Cline插件、Postman及Python项目中...
一次Token是一次调用？你可能误解了大模型的计费单位
2025-04-16 11:20

越哥聊AI的博客不等于字或词Token 用来干嘛模型输入输出的计费依据Token 怎么算按字符分割，有经验公式和工具可查如何节省 Token优化提示词、控制 max_tokens、拆分上下文Token 的底层意义是模型注意力机制的基本计算单位如果你...
AI智能体实战｜从零开始获取Kimi(Moonshot) API KEY并接入自动化流程
2026-03-09 01:46

Zewei Chu的博客本文详细介绍了如何从零开始获取Kimi(Moonshot) API KEY，并将其接入自动化流程。...此外，还探讨了如何将Kimi API集成到微信机器人等AI智能体中，实现自动化工作流，为开发者构建私有化AI应用提供了实战指南。
Dify平台适配主流大模型：灵活调用Token资源的最佳实践
2025-12-26 01:02

亿风行的博客通过Dify平台，企业可灵活编排RAG与Agent工作流，动态切换主流大模型，精细化控制Token消耗。其可视化流程设计、上下文压缩、缓存机制和多模型路由能力，显著降低AI应用落地成本，提升响应稳定性与运维效率。
Kimi API 实战指南：Moonshot AI 超长上下文模型集成与应用
2026-03-10 00:26

执笔画书生的博客本文是Kimi API的实战指南，详细介绍了如何集成与应用Moonshot AI的超长上下文模型。内容涵盖从API Key获取、Python快速集成，到文件上传、长文档处理等核心功能，并提供了构建企业级智能问答系统的完整思路，帮助...
月之暗面：Moonshot AI接口总结
2024-02-23 17:05

幸福清风的博客开发者们只需访问，便能创建自己的 API Key，进而将 Kimi 智能助手背后的同款 moonshot 模型能力，如长文本处理和出色的指令遵循等，集成至自己的产品中。这不仅增强了现有产品的功能，更为开发者们提供了打造全新、...
利用Python调用KimiGPT API接口实战指南
2024-06-11 16:40

幂简集成的博客 Kimi作为国内目前广受欢迎的AI工具，因其出色的性能和智能功能，迅速赢得了大量用户的青睐。本文将详细介绍如何利用Python调用KimiGPT API接口。
不用OpenAI也能玩转AI视频生成？实测Moonshot+MoneyPrinterTurbo本地部署方案
2025-08-22 01:03

root9的博客本文实测了无需依赖OpenAI的AI视频生成本地部署方案，详细介绍了如何利用Moonshot大模型与开源项目MoneyPrinterTurbo搭建自动化短视频生成工作流。该方案解决了国内开发者面临的可访问性、成本与数据隐私等痛点，...
OneAPI DeepSeek与Moonshot模型调用教程：国产高性能模型统一接入
2026-03-22 01:11

谢兴豪的博客本文介绍了如何在星图GPU平台上自动化部署OneAPI镜像，该镜像通过标准的OpenAI API格式统一访问DeepSeek、Moonshot等主流大模型，实现开箱即用。用户可基于此平台快速构建AI应用，例如，轻松调用不同模型进行代码...
AI应用，AI模型API，第三方整合、Token 流转之间的关系说明
2026-03-22 14:55

code小生的博客 AI 各个调用逻辑和词汇，做过开发的朋友就很清楚了，这其实和以往的开发途中调用第三方平台流程是一样的，都是先去购买服务，然后调用 api 实现自己需要的功能，只不过在 AI 这里面多了一个计费单位（token）。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月22日

MoonShot API调用Token计算计费

问题遇到的现象和发生背景

1条回答 默认 最新

问题事件

1条回答默认最新