疯狂的百度 2021-11-29 10:25 采纳率: 46.7%
浏览 11
已结题

不同编码格式文件上传后端解析如何做到兼容?

不同电脑创建的excel(csv) 编码格式不同,有gbk,ISO-8859-1,utf-8 当上传后后端拿到文件流解析时,我如何兼容的去解析?不出现乱码

  • 写回答

1条回答 默认 最新

  • 冰思雨 2021-11-29 10:40
    关注

    两方面考虑:

    1. 客户端上传文件的时候,带上文件的编码。
    2. 对于没有带上文件编码的情况,服务端在处理文件之前,根据文件的数据内容判断出文件使用的编码。

    根据楼主的表述,应该是不考虑1的情况了。
    如果只有楼主说的3中编码的话,可以自己编写探测程序进行排查。
    GBK编码是变长双字节编码,有时候是一个字节表示一个字符,有时候是两个字节表示一个字符。
    UTF-8编码是变长四字节编码,有一、二、三、四个字节表示一个字符的情况。
    ISO-8859-1编码是西欧编码,定长一字节编码。如果前两个编码没有适配成功的话,那就可以适配这个编码。


    楼主可以根据上述三个编码的特征进行判断。编码特征我没有写出来。这需要楼主对编码技术有一定的了解。


    上述三种编码都对 ASCII 编码有兼容。如果文件的内容是 ASCII 编码的数据,适配上述三种编码的任意一种都不影响文件的数据处理。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月7日
  • 已采纳回答 11月29日
  • 创建了问题 11月29日

悬赏问题

  • ¥15 如何把LibreOffice添加到自定义层中
  • ¥35 这个的负序网络和零序网络怎么画?(答疑)
  • ¥200 基于同花顺supermind的量化策略脚本编辑
  • ¥20 Html备忘录页面制作
  • ¥15 黄永刚的晶体塑性子程序中输入的材料参数里的晶体取向参数是什么形式的?
  • ¥20 数学建模来解决我这个问题
  • ¥15 计算机网络ip分片偏移量计算头部是-20还是-40呀
  • ¥15 stc15f2k60s2单片机关于流水灯,时钟,定时器,矩阵键盘等方面的综合问题
  • ¥15 YOLOv8已有一个初步的检测模型,想利用这个模型对新的图片进行自动标注,生成labellmg可以识别的数据,再手动修改。如何操作?
  • ¥30 NIRfast软件使用指导