python如何实现批量修改文件编码为utf8

我下载了Udacity的视频，但是中文字幕是vtt格式的，于是在网上看了几个python批量转换vtt为srt的方法，因为遇到gbk和utf8神马的问题，自己修改了下，终于能运行了，但是转换后的srt字幕是乱码。后来发现只要把srt的文件另存为时改编码为utf8就可以看了，请问怎么把srt批量修改成编码utf8？？或者在转换的过程中就保存为utf8,转换的代码如下：

#coding = utf-8
import os
import re
path = r"D:\课件临时\2"
vttName = []                                     

for i in os.listdir(path):
    name = i.split('.')
    if name[-1] == 'vtt':
        vttName.append(i)

for vttname in vttName:
    vtt = open(path + "\\" + vttname,'rb')
    filevtt = vtt.read().decode('utf-8')
    vtt.close()
     #print filevtt
    listvtt = filevtt.split('.')
     #print listvtt
     #print listvtt[0][8:]
    strvtt = listvtt[0][8:]
    for i in range(1 , len(listvtt) ):
        strvtt = strvtt + "," + listvtt[i]

     #print strvtt

    srtName = vttname.split('.')
    srtt = open(path + '\\' + srtName[0] + '.srt','bw')
    for r in strvtt:
        r=r.encode('utf-8')
        srtt.write(r)


    srtt.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

Die_Willow 2018-03-21 17:13

关注

此处用的是python2，main函数为主函数，请采纳，如有疑问，请回复。

 # coding = utf-8
import os
path = r"D:\课件临时\2"

def conversion_coding(file_name, before='gbk', after='utf8'):
    # 此处转化文件编码，默认源文件编码为gbk，转换为utf8。
    # 原理： 读取文件中所有的内容（缓存到内存中），然后覆盖原文件（将缓存中的内容重新存入新文件）
    try:
        with open(file_name,'r',encoding = before ) as f:
            file_data = f.readlines()
        with open(file_name,'w',encoding = after) as f:
            f.writelines(file_data)
    except Exception as e:
        print '转换文件“{0}”失败！:{1}'.format(file_name, e)


def get_file_name(dir_path):
    if os.path.isdir(dir_path):
    # 获取目录下所有的文件，此处可添加文件筛选规则，如后缀为txt的文件将被返回
        for file_name in os.listdir(dir_path):
        # 此处对文件进行筛选
            if file_name.split('.')[-1] == 'vtt':
            yield os.path.join(dir_path, file_name)
    else:
        print('"{0}" 这不是一个目录'.format(dir_path))


def main():
    # path = raw_input("请输入转换目录：")  # 取消注释可修改为根据输入的目录进行转换
    for file_name in get_file_name(path):
        conversion_coding(file_name)

main()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(4条)

报告相同问题？

关注问题

使用python批量转换文件编码为UTF-8的实现
2020-09-17 14:59

本文将详细讲解如何使用Python批量将文件编码转换为UTF-8。首先，我们要了解Python中处理文件编码的基本操作。在Python中，打开文件时可以指定文件的编码。例如，使用`open(filename, 'r', encoding='utf-8')`来以...
使用python批量转换文件编码为UTF-8
2021-01-20 02:52

由于以前脑残的我不知道改编码方式，导致出现了大量的GBK，这就很难受，要是一个两个还好说，可是这么多要是一个一个的改我会觉得现在的我比以前还脑残，于是乎，我就想用python批量的修改一下，然后就产生了这篇...
Python批量修改文件编码为 utf-8, 亲测Windows-1254可成功转码!
2024-06-15 00:33

゛ઇ沐沐ଓ゜的博客遍历文件列表获取编码信息, 并将非'utf-8'文件自动转码为'utf-8', 解决文件无法解码的问题, 代码简单易懂.
python实现批量转换文件编码(批转换编码示例)
2020-12-23 18:09

本示例将介绍如何使用Python批量转换文件的编码格式。在处理跨语言或不同系统间的数据时，不同编码间的转换常常是必不可少的步骤。首先，我们要了解Python中的编码处理。在Python 3中，字符串默认采用UTF-8编码。`...
Python实现批量转换文件编码的方法
2020-09-21 20:49

接下来是本文的核心部分——使用Python批量转换文件编码的具体实现。下面的代码展示了如何将指定目录下的所有文件从GBK编码转换为UTF-8编码。 ```python import os import shutil def match(config, fullpath, ...
如何利用python批量转换文件编码？例如，txt文件由UTF-16LE转为UTF-8……
2020-12-21 08:54

本篇文章将介绍如何利用Python批量转换文件编码，以解决处理数据时遇到的编码问题。我们将以一个具体的例子来说明，即如何将TXT文件从UTF-16LE编码转换为UTF-8编码。首先，我们要导入必要的库。`os`库用于操作文件...
Python批量转换文件编码格式
2020-09-22 01:46

具体来说，我们需要编写一个Python脚本来遍历指定目录下的所有文件，并将GBK编码的文件转换为UTF-8编码。为了使脚本更具通用性，我们还考虑到了不同Python版本（如Python 2.x和Python 3.x）之间的差异。 #### 实现...
字符编码UTF8转GB2312+可批量转换+需安装Python
2023-04-12 11:19

该工具用于字符编码UTF8转GB2312，可批量转换。只需将该工具放置与需要转换文件的目录下，双击运行即可。注意：需安装Python，Python 2和3 需安装通用编码检测器，文件内有安装方法；该工具对于入门学习Python 也...
Python实现编码ANSI转UTF8
2019-12-25 15:03

Windows文档默认编码是ANSI，Linux文档默认编码是UTF8。项目进行平台移植（Windows—>Linux）时涉及到大量文档编码格式转换，即TXT...代码中Python实现了指定目录下TXT文档编码ANSI转UTF8。批量转换。简单。易实现。
python批量修改文件编码格式的方法
2020-09-20 10:51

### Python批量修改文件编码格式的方法在日常工作中，我们经常需要处理不同编码格式的文件，尤其是在涉及多语言或历史遗留项目时。不一致的文件编码可能会导致读取错误或者显示乱码等问题。因此，掌握如何批量修改...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

python如何实现批量修改文件编码为utf8

5条回答默认最新

码龄粉丝数原力等级 --

python如何实现批量修改文件编码为utf8

5条回答 默认 最新

5条回答默认最新