VS Studio中nlohmann JSON解析中文乱码问题

在使用 Visual Studio 开发 C++ 项目时，集成 nlohmann/json 库解析包含中文的 JSON 字符串常出现乱码问题。典型表现为：读取含中文字段的 JSON 文件或字符串后，输出显示为问号、方块或乱码字符。该问题多源于源文件编码格式（如 GBK）与程序运行时 UTF-8 编码不一致，或未正确设置控制台输出编码。尽管 nlohmann/json 原生支持 UTF-8，但 Windows 平台默认代码页非 UTF-8，导致宽字符转换失败。如何确保源文件、字符串编码与运行环境统一，是解决中文乱码的关键所在。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

狐狸晨曦 2025-11-01 18:30

关注

1. 问题现象与初步诊断

在使用 Visual Studio 开发 C++ 项目并集成 nlohmann/json 库时，开发者常遇到解析包含中文的 JSON 字符串后输出乱码的问题。典型表现为控制台显示为“？？”、“□”或不可读字符。该现象多出现在 Windows 平台下，尤其当源文件以 GBK 或 ANSI 编码保存时。

尽管 nlohmann/json 原生支持 UTF-8 编码，但由于 Visual Studio 默认使用系统本地代码页（如简体中文 Windows 使用 CP936/GBK），导致字符串在编译期即被错误解码。此外，控制台默认代码页通常为 437 或 936，而非 UTF-8，进一步加剧了输出乱码问题。

2. 深层原因分析：编码链断裂

源文件编码不一致：Visual Studio 中若未明确设置文件为 UTF-8（带 BOM 或无 BOM），则可能以 ANSI/GBK 存储，导致编译器误读中文字符。
运行时环境编码缺失：Windows 控制台默认不启用 UTF-8 模式（chcp 65001），宽字符转换失败。
JSON 解析器输入非 UTF-8：即使库支持 UTF-8，若传入的字符串实际为 GBK 编码，则解析结果自然出错。
标准输出流未适配 Unicode：C++ 的 std::cout 在非 UTF-8 环境下无法正确渲染多字节字符。

3. 编码一致性检查流程图

graph TD
    A[JSON 源文件] -->|编码格式| B{是否 UTF-8?}
    B -- 否 --> C[转换为 UTF-8]
    B -- 是 --> D[读取为 std::string]
    D --> E[nlohmann::json::parse()]
    E --> F{解析成功?}
    F -- 否 --> G[检查输入是否含 BOM 或非法字节]
    F -- 是 --> H[输出到控制台]
    H --> I{控制台代码页=65001?}
    I -- 否 --> J[执行 chcp 65001 或 SetConsoleOutputCP(65001)]
    I -- 是 --> K[正常显示中文]

4. 解决方案层级结构

层级	措施	适用场景	实施难度
Level 1	保存源文件为 UTF-8 with BOM	小型项目、快速修复	★☆☆☆☆
Level 2	使用 `#pragma execution_character_set("utf-8")`	Visual Studio 特定项目	★★☆☆☆
Level 3	调用 `SetConsoleOutputCP(65001)`	控制台程序输出	★★★☆☆
Level 4	预处理 GBK 转 UTF-8（Windows API MultiByteToWideChar）	遗留系统兼容	★★★★☆
Level 5	CMake 配置统一编码策略 + ICU 库支持	跨平台大型项目	★★★★★

5. 实际代码示例：完整解决方案


#include <iostream>
#include <fstream>
#include <string>
#include <windows.h>
#define JSON_USE_IMPLICIT_CONVERSIONS 1
#include <nlohmann/json.hpp>

// 设置控制台为 UTF-8 输出
void SetupConsoleUTF8() {
    SetConsoleOutputCP(CP_UTF8);
    SetConsoleCP(CP_UTF8);
}

// GBK to UTF-8 转换函数（适用于读取 GBK 编码 JSON 文件）
std::string GBKToUTF8(const std::string& gbkStr) {
    int wideLen = MultiByteToWideChar(CP_ACP, 0, gbkStr.c_str(), -1, nullptr, 0);
    wchar_t* wideBuf = new wchar_t[wideLen];
    MultiByteToWideChar(CP_ACP, 0, gbkStr.c_str(), -1, wideBuf, wideLen);

    int utf8Len = WideCharToMultiByte(CP_UTF8, 0, wideBuf, -1, nullptr, 0, nullptr, nullptr);
    char* utf8Buf = new char[utf8Len];
    WideCharToMultiByte(CP_UTF8, 0, wideBuf, -1, utf8Buf, utf8Len, nullptr, nullptr);

    std::string result(utf8Buf);
    delete[] wideBuf;
    delete[] utf8Buf;
    return result;
}

int main() {
    SetupConsoleUTF8();

    // 方法一：直接使用 UTF-8 编码的字符串（确保源文件保存为 UTF-8）
    std::string jsonStr = R"({"name": "张三", "city": "北京"})";
    
    try {
        auto j = nlohmann::json::parse(jsonStr);
        std::cout << std::setw(4) << j << std::endl;  // 正常输出中文
    } catch (const nlohmann::json::exception& e) {
        std::cerr << "Parse error: " << e.what() << std::endl;
    }

    // 方法二：读取外部 GBK 编码文件并转换
    std::ifstream file("data.json");  // 假设文件为 GBK 编码
    if (file.is_open()) {
        std::string content((std::istreambuf_iterator<char>(file)),
                            std::istreambuf_iterator<char>());
        file.close();

        std::string utf8Content = GBKToUTF8(content);
        auto j = nlohmann::json::parse(utf8Content);
        std::cout << std::setw(4) << j << std::endl;
    }
}

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

【C++】JsonCPP
2026-03-13 14:39

白藏crab的博客 json基础、jisoncpp库、基本接口、基本使用
VSCode+C/C++环境搭建避坑指南：从MinGW安装到调试配置全流程
2025-10-18 02:59

烧烤摊在逃五花肉的博客本文提供了一份详尽的VSCode+C/C++编程环境搭建指南，涵盖从MinGW编译器选择...重点解析了新手常遇的编译错误、调试断点失效及中文乱码等问题的解决方案，旨在帮助开发者高效避坑，快速构建稳定高效的C/C++开发环境。
C++ 【学习备忘】
2021-11-20 20:19

Yup_Boss的博客 17、友元函数及友元类 18、#include和#include“ ”的区别 19、模板编程二、C++11新特性 1、C++左值和右值 2、智能指针（smart pointer） 2.1 shared_ptr（共享指针） 2.2 unique_ptr 2.3 weak_ptr（弱指针） 2.4 ...
CString类型转换全攻略：5种方法解决MFC与STL混编时的乱码问题
2026-03-14 01:27

余时行的博客本文深入解析MFC与STL混合编程中CString类型转换引发乱码的根源，并提供五种核心转换方法。重点涵盖CString与std::string在ANSI、Unicode及UTF-8编码间的安全互转，帮助开发者构建健壮的Windows混合编程体系，彻底...
Dear ImGui避坑指南：从‘Hello World’到编辑器插件开发的7个关键技巧
2025-10-23 04:43

wine的博客本文为C++开发者提供了一份Dea...文章深入解析了字体加载、多线程安全、Unreal/Unity引擎集成、Docking视口管理、自定义样式、性能优化及错误处理等7个关键技巧，旨在帮助开发者构建稳定、高效且可维护的专业级UI工具。
基于共享内存的MCP服务器：实现AI应用间高速数据交换
2014-07-08 14:54

weixin_30425949的博客进程间通信（IPC）是分布式系统和多进程应用开发中的基础技术，用于实现不同进程间的数据交换与协同工作。其核心原理在于操作系统提供的多种IPC机制，如管道、消息队列、信号量和共享内存等，其中共享内存因其接近零...
Windows平台C语言编程入门利器：一键编译运行小工具
2025-09-25 01:04

SpaceX的博客在进入具体工具设计与实现之前，必须深入理解Windows操作系统下C语言...通过分析现有IDE（如Code::Blocks、Dev-C++、Visual Studio）的复杂性与资源占用问题，引出对“极简但功能完备”的C语言编译运行工具的需求背景。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月1日