GOODUU 2020-05-08 12:51 采纳率: 0%
浏览 955
已结题

Python用win32com调用word 多语言内容 SaveAs2为文本文件时乱码,编码设置为UTF-8 ,65001如何生效?

Python用win32com调用word SaveAs2为文本文件时,内容有多语言,如泰语、俄语等编码设置为UTF-8 ,65001,另存为文本文件.txt内容为乱码
按照MSDN Document.SaveAs2 方法设置参数,但没有变化,设置了参数
FileFormat,Encoding 但是不起作用,望有经验的指导一二。

主要处理代码

import os
import chardet
import sys
import re
import os.path
from win32com import client as wc

......
word = wc.Dispatch('Word.Application')
def merge(file_name,file_path,old_file_name):
    if (not (os.path.basename(file_name)).startswith('~') and file_name.split('.')[-1] == 'docx'):
        doc = word.Documents.Open(file_name)
        newname= file_name[:-5]+".txt"
        try:
          Encoding1 = 65001
          doc.SaveAs2(FileName = newname,FileFormat = 2 ,Encoding = Encoding1)
          print(file_name + ' 转换文件成功!')
        except Exception as e:
          print('**********' + file_name + ' 转换失败!**********')
          pass
        doc.Close()

这里的参数设置了Encoding没有用
doc.SaveAs2(FileName = newname,FileFormat = 2 ,Encoding = Encoding1)

  • 写回答

2条回答 默认 最新

  • threenewbee 2020-05-08 13:15
    关注

    你试试看saveas成csv格式。其实也就是文本格式

    评论

报告相同问题?

悬赏问题

  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)
  • ¥20 matlab yalmip kkt 双层优化问题
  • ¥15 如何在3D高斯飞溅的渲染的场景中获得一个可控的旋转物体
  • ¥88 实在没有想法,需要个思路
  • ¥15 MATLAB报错输入参数太多
  • ¥15 python中合并修改日期相同的CSV文件并按照修改日期的名字命名文件
  • ¥15 有赏,i卡绘世画不出
  • ¥15 如何用stata画出文献中常见的安慰剂检验图
  • ¥15 c语言链表结构体数据插入