GOODUU 2020-05-08 12:51 采纳率: 0%
浏览 958
已结题

Python用win32com调用word 多语言内容 SaveAs2为文本文件时乱码,编码设置为UTF-8 ,65001如何生效?

Python用win32com调用word SaveAs2为文本文件时,内容有多语言,如泰语、俄语等编码设置为UTF-8 ,65001,另存为文本文件.txt内容为乱码
按照MSDN Document.SaveAs2 方法设置参数,但没有变化,设置了参数
FileFormat,Encoding 但是不起作用,望有经验的指导一二。

主要处理代码

import os
import chardet
import sys
import re
import os.path
from win32com import client as wc

......
word = wc.Dispatch('Word.Application')
def merge(file_name,file_path,old_file_name):
    if (not (os.path.basename(file_name)).startswith('~') and file_name.split('.')[-1] == 'docx'):
        doc = word.Documents.Open(file_name)
        newname= file_name[:-5]+".txt"
        try:
          Encoding1 = 65001
          doc.SaveAs2(FileName = newname,FileFormat = 2 ,Encoding = Encoding1)
          print(file_name + ' 转换文件成功!')
        except Exception as e:
          print('**********' + file_name + ' 转换失败!**********')
          pass
        doc.Close()

这里的参数设置了Encoding没有用
doc.SaveAs2(FileName = newname,FileFormat = 2 ,Encoding = Encoding1)

  • 写回答

2条回答 默认 最新

  • threenewbee 2020-05-08 13:15
    关注

    你试试看saveas成csv格式。其实也就是文本格式

    评论

报告相同问题?

悬赏问题

  • ¥15 使用C#,asp.net读取Excel文件并保存到Oracle数据库
  • ¥15 C# datagridview 单元格显示进度及值
  • ¥15 thinkphp6配合social login单点登录问题
  • ¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场 部分对应不上
  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配