我是全宇宙ENERGE的总量 2019-05-12 22:37 采纳率: 100%
浏览 2857
已采纳

求救!python 读入文件,将其转存成UTF-8格式

编写程序,用户在命令提示行输入文件名和该文件的编码格式,读入文件,将其转存成UTF-8格式。如果用户没有指定输入文件的编码格式,则使用chardet模块“猜”出其编码格式,用于解码。使用argparse模块解析用户命令提示行输入。

  • 写回答

3条回答 默认 最新

  • 关注
    import chardet
    import argparse
    import os
    import codecs
    
    
    def get_encoding(file_name):
        f = open(file_name, 'rb')
        encoding = chardet.detect(f.read())['encoding']
        return encoding
    
    
    def write(file_name, content):
        with codecs.open(file_name, 'w', 'utf-8') as f:
            f.write(content)
    
    
    def read(file_name, encoding):
        with codecs.open(file_name, 'r', encoding) as f:
            return f.read()
    
    
    def build(input_file_name):
        dirname = os.path.dirname(input_file_name)
        base = os.path.splitext(os.path.basename(input_file_name))
        return os.path.join(dirname, ''.join(base[0] + r' utf-8'+base[-1]))
    
    
    def init_parser():
        parser = argparse.ArgumentParser()
        parser.add_argument(r'input')
        parser.add_argument(r'-e', '--encoding')
        parser.add_argument(r'-o', '--output')
        return parser
    
    
    if __name__ == '__main__':
        parser = init_parser()
        args = parser.parse_args()
        input_file_name = args.input
        encoding_file = args.encoding or get_encoding(input_file_name)
        output = args.output or build(input_file_name)
        content = None
        try:
            content = read(input_file_name, encoding_file)
        except OSError:
            print("something wrong")
        finally:
            write(output, content)
            print("Done")
    

    时隔多年,我答我自己

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器