Python 3如何读取ANSI编码格式的txt文件?

我有许多个txt文件,因此无法一一转存,只能用python批量读取。
用notepad++发现编码格式是ANSI,找了许多的方法都无法解决。我将一个文件上传了,请帮忙看下如何读取!

3个回答

你的文件第有多个B0字节,不管用GB18030还是UTF-8都没法解码,所以我能做的仅仅是忽略这个解码错误,在open函数中加上参数error="ignore".

with open("1.txt", encoding="utf-8",errors="ignore") as f:
print(f.read())


代码首行添加
# -*- coding: GBK -*-

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
用Sublime写python读取txt文件
读取文件不是显示找不到.py文件,就是显示找不到txt文件,可是他们都好好的在同一个文件夹下面啊。 ![图片说明](https://img-ask.csdn.net/upload/201804/13/1523599046_602240.png) ![图片说明](https://img-ask.csdn.net/upload/201804/13/1523599101_353503.png) ![图片说明](https://img-ask.csdn.net/upload/201804/13/1523599111_189295.png) ![图片说明](https://img-ask.csdn.net/upload/201804/13/1523598932_254824.png)
python处理csv文件的编码格式问题
#csv模块中的DictReader函数中编码的问题 处理日常的csv文件筛选问题中,通过以下的一段小代码,发现不同的编码格式下的程序有不同的错误,如下: #encoding=utf-8 import csv with open('3020100_2019_qb.csv','r') as f: f_field = csv.reader(f,delimiter = '|') fieldnames = next(f_field) print(fieldnames) f_read = csv.DictReader(f,delimiter = '|',fieldnames=fieldnames) a = [] for row in f_read: d = {} for k , v in row.items(): d[k] = v a.append(d) print(a) with open('1211.csv','wt') as f: writer = csv.DictWriter(f,fieldnames=fieldnames) writer.writeheader() for i in a : #if i[' '] == ' ': writer.writerow(i) ``` 错误提示(开头修改为#encoding=gbk也是同样的报错): ``` Traceback (most recent call last): File "E:/pycharm_file/csv_handle.py", line 10, in <module> for row in f_read: File "E:\anaconda\lib\csv.py", line 112, in __next__ row = next(self.reader) UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 4781: illegal multibyte sequence ```
python 如何判断 javascript 的源文件编码格式为UTF-8?
python 如何判断 javascript 的源文件编码格式为UTF-8?
python如何操作HDFS读取Mapfile 文件
请问使用python可以读取HDFS的MapFile文件吗?如果可以,相关API是什么啊?在线等。。。
windows下用pycharm读取txt文件编码问题
最近要做的一项工作需要下载一个txt文件作为字典,但是下载下来之后读取出了问题,原本的文件是这样的: ![图片说明](https://img-ask.csdn.net/upload/201709/22/1506064260_184216.png) 但是通过pycharm用python读取后结果是这样的(pycharm的编码设置为utf-8): ![图片说明](https://img-ask.csdn.net/upload/201709/22/1506064346_304563.png) 更奇怪的是通过交互式python读取文件就可以正常显示 然后我把文件另存为utf-8编码格式,这次读取后中文可以正常显示,但是其中的空格出了问题,完全打印不出来: ![图片说明](https://img-ask.csdn.net/upload/201709/22/1506064502_739731.png) 最后一行的内容:zyzzyvan.象鼻虫 正常显示应该是:zyzzyva n. 象鼻虫 请大家看看到底是什么问题,谢谢啦
Python 读取Latin1编码的文件,按行输出时缺失内容
各位大神好,小弟最近开始接触python,在读取一个以Latin1编码的文件并按行输出到屏幕时字符串少了一部分,输出前换成其他编码还是不行。 ![图片说明](https://img-ask.csdn.net/upload/201512/02/1449033626_385094.png) 这是直接输cat输出的内容 ![图片说明](https://img-ask.csdn.net/upload/201512/02/1449033682_791794.png) 这是我读取后的内容 文件的读取方式是这样的 ![图片说明](https://img-ask.csdn.net/upload/201512/02/1449033837_815613.png) 输出是这样的 ![图片说明](https://img-ask.csdn.net/upload/201512/02/1449033869_347197.png) 麻烦各位大神帮忙看看是什么情况
python小白 求助 读取文件夹下txt文件,并进行数据处理
一个文件夹下有若干个txt文件,格式基本都相同。 逐个打开 从第32行开始读 内容格式如下: 0.011129 2 3CD Rx d 8 00 00 FF FF 0B 22 60 FE 0.011476 5 1E7 Rx d 8 02 19 FF 65 FF 80 01 00 0.011507 7 1E7 Rx d 8 02 19 FF 65 FF 80 01 00 0.011593 2 40D Rx d 8 23 48 30 3C 3B 08 55 48 0.011598 4 32D Rx d 8 7F 24 09 00 7F 40 00 86 0.012584 2 44D Rx d 8 21 86 21 6C 21 6E 41 3B 0.012588 4 40D Rx d 8 23 48 30 3C 3B 08 55 48 (我想应该先用正则函数分割) 分析的话 我举个例子 如果第3列 值是3CD 取最后一次出现这个字符的行(因此这个值可能会出现好多次),并将后面的00 00 FF FF 0B 22 60 FE 由16进制转化为10进制 然后输出一个excle表格 格式是 文件名 3CD 1E7 (txt文件名) (十进制的值 ) (十进制的值) ![图片说明](https://img-ask.csdn.net/upload/201906/19/1560928859_197613.png)
python读取dat文件数据
dat文件中的数据已用IDL读取,可获取到3维数组,表示的是跨越一段时间的一个地理区域的植被信息; 现在,想要用python来读取同一个文件,识别成3维数组。 问题:用python具体怎样操作呢,能否提供具体的代码呢,尝试着可以之后再去理解。 跪求大神的帮助,万分期待与感谢。 总共就5个币,全给了哈! 首先,非常感谢大家的回答,现对问题补充如下: 11.7GB 大小的dat数据文件,使用readline循环读出,却显示只有4行,而且显示乱码 ,判断了编码格式,结果如下: ![图片说明](https://img-ask.csdn.net/upload/201603/11/1457661134_786702.png)
Python或c#实现图片格式的PDF转txt
Python或C#有什么办法能比较好使将图片格式的pdf文件转为txt,同时需要能带格式的 地识别图片中的表格
python3读取word文件报错
运行时,AttributeError: 'NoneType' object has no attribute 'paragraphs'的错误,请大佬解决一下。 ``` # 读取word #coding=utf-8 import win32com import win32com.client def readWord(path): #调用系统word功能,可以处理doc和docx文件 mw= win32com.client.Dispatch('Word.Application') # 打开文件 doc=mw.Documents.Open(path) for paragraph in doc.paragraphs: line=paragraph.Range.Text print(line) # 关闭文件 doc.close() # 退出word mw.Quit() path=r'‪C:\Users\cuichuang1\Desktop\aaa.docx' readWord(path) ```
如何才能实现python文件读取中对注释行的识别
本人有一个任务,要求用python读取某一文件中的注释行,空行和编码行,哪位大神知道怎么做,求教
python读取txt文件里面的数据怎么处理?
python读取txt文件里面的数据怎么处理成为列表里面包含字典? ``` 'account':'123', 'password':'123', 'money':10000, 'kind':'金卡' 'account':'222', 'password':'123', 'money':10000, 'kind':'金卡' 'account':'333', 'password':'123', 'money':10000, 'kind':'金卡' ``` 就像这样的数据,怎么读取后在程序里转变为 ``` infors = [ {'account':'123', 'password':'123', 'money':10000, 'kind':'金卡'}, {'account':'222', 'password':'123', 'money':10000, 'kind':'金卡'}, {'account':'333', 'password':'123', 'money':10000, 'kind':'金卡'} ] ``` 这样???? 大佬,求解
python3在环境编码为GBK的主机上的使用方式
公司让我用python3在的一台UNIX主机上编写工具,遇到很奇葩的问题,总结如下: 1、公司默认的环境编码是无从考察,通过locale命令发现居然没有定义默认的编码,因为是UNIX主机,所以我也不知道上哪找材料解决这个问题,不知道哪位大神可以指点一下; 2、公司通过CRT远程登陆,不知道为什么,所有人都默认将CRT的环境编码设置为GB2312,这导致所有文件的编码格式都是GB2312,有可能是主机就是GB2312,也可能是历史原因; 3、公司让我将一个文件的内容制作成xlsx,这个文件是GB2312格式,过程会用到python3的XlsxWriter,而我发现这个模块使用UTF-8编码; 4、在我尝试处理这个问题的时候,我发现我在脚本中的第二行设置coding:GB2312居然无效,代码中包含中文居然会报错; 请问这种情况下我应该如何处理?
python中从txt中读取列表的疑问
[0.0, 2.303100877063917, 4.086570419967091, 4.5257380393305064, 4.84985960671861, 5.317629700058278] 我的 txt文件大概长这样,是原来用python将列表写入到txt文件中的 但是读取这个列表的时候,确实能显示这些数 但是调用的时候print list(0)显示的是[ print list(1)显示的是0 print list(3)显示的是. 大家有什么好办法吗 我想print list(0)显示0.0 printlist(1)显示2.303100877063917 我的txt已经生成了 用这个txt的情况下有办法解决吗 谢谢大家
python读取nc文件 报错问题
``` #!/usr/bin/env python # -*- coding:utf-8 -*- import netCDF4 as nc filename = 'D:\\Python\\python\\广西流域1801.nc' # .nc文件名 f = nc.Dataset(filename) # 读取.nc文件,传入f中。此时f包含了该.nc文件的全部信息 all_vars = f.variables.keys() #获取所有变量名称 print(len(all_vars)) #长度为18 ``` 这是代码快 不会用python 报错了 求助啥意思呀? Traceback (most recent call last): File "D:/Python/Lpython/venv/readNC.py", line 7, in <module> f = nc.Dataset(filename) File "netCDF4\_netCDF4.pyx", line 2321, in netCDF4._netCDF4.Dataset.__init__ File "netCDF4\_netCDF4.pyx", line 1885, in netCDF4._netCDF4._ensure_nc_success FileNotFoundError: [Errno 2] No such file or directory: b'D:\\Python\\python\\\xe5\xb9\xbf\xe8\xa5\xbf\xe6\xb5\x81\xe5\x9f\x9f1801.nc'
Python 删除TXT文件的指定行
问下Python 中读取TXT文件的每一行,匹配有例如:rating的行就删除该行或者将rating替换为avg也可以,怎么写啊? (该文本中的每行都有空格,开头也可能有空格),谢谢啦,嘿嘿
如何用python读取TXT文件的特定内容
![图片说明](https://img-ask.csdn.net/upload/201811/18/1542521560_747455.png) 如图,TXT文件里的每段内容都是以PT P开始,ER结束,怎样提取每段内容里PN,TI,AU 后的数据
python读取txt文件中的array
一个txt文件中的文本格式如下所示: [[-0.056557,0.053254],[-0.042491,0.040662],[-0.061258,0.067239],[-0.067659,0.044261]] 怎样从这个txt中将它都成np.array的格式
Python Myqr如何读取指定文件生成二维码?
看了myqr的描述后面可以是网站或者文本,但是我需要生成的二维码数据比较多,直接输在里面不太方便,如何直接读取文件里的内容生成二维码呢?试了下用变量赋值会报错
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入 假设现有4个人...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
经典算法(5)杨辉三角
杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。
使用 Docker 部署 Spring Boot 项目
Docker 技术发展为微服务落地提供了更加便利的环境,使用 Docker 部署 Spring Boot 其实非常简单,这篇文章我们就来简单学习下。首先构建一个简单的 S...
英特尔不为人知的 B 面
从 PC 时代至今,众人只知在 CPU、GPU、XPU、制程、工艺等战场中,英特尔在与同行硬件芯片制造商们的竞争中杀出重围,且在不断的成长进化中,成为全球知名的半导体公司。殊不知,在「刚硬」的背后,英特尔「柔性」的软件早已经做到了全方位的支持与支撑,并持续发挥独特的生态价值,推动产业合作共赢。 而对于这一不知人知的 B 面,很多人将其称之为英特尔隐形的翅膀,虽低调,但是影响力却不容小觑。 那么,在...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
刷了几千道算法题,这些我私藏的刷题网站都在这里了!
遥想当年,机缘巧合入了 ACM 的坑,周边巨擘林立,从此过上了"天天被虐似死狗"的生活… 然而我是谁,我可是死狗中的战斗鸡,智力不够那刷题来凑,开始了夜以继日哼哧哼哧刷题的日子,从此"读题与提交齐飞, AC 与 WA 一色 ",我惊喜的发现被题虐既刺激又有快感,那一刻我泪流满面。这么好的事儿作为一个正直的人绝不能自己独享,经过激烈的颅内斗争,我决定把我私藏的十几个 T 的,阿不,十几个刷题网...
白话阿里巴巴Java开发手册高级篇
不久前,阿里巴巴发布了《阿里巴巴Java开发手册》,总结了阿里巴巴内部实际项目开发过程中开发人员应该遵守的研发流程规范,这些流程规范在一定程度上能够保证最终的项目交付质量,通过在时间中总结模式,并推广给广大开发人员,来避免研发人员在实践中容易犯的错误,确保最终在大规模协作的项目中达成既定目标。 无独有偶,笔者去年在公司里负责升级和制定研发流程、设计模板、设计标准、代码标准等规范,并在实际工作中进行...
SQL-小白最佳入门sql查询一
不要偷偷的查询我的个人资料,即使你再喜欢我,也不要这样,真的不好;
redis分布式锁,面试官请随便问,我都会
文章有点长并且绕,先来个图片缓冲下! 前言 现在的业务场景越来越复杂,使用的架构也就越来越复杂,分布式、高并发已经是业务要求的常态。像腾讯系的不少服务,还有CDN优化、异地多备份等处理。 说到分布式,就必然涉及到分布式锁的概念,如何保证不同机器不同线程的分布式锁同步呢? 实现要点 互斥性,同一时刻,智能有一个客户端持有锁。 防止死锁发生,如果持有锁的客户端崩溃没有主动释放锁,也要保证锁可以正常释...
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
Nginx 原理和架构
Nginx 是一个免费的,开源的,高性能的 HTTP 服务器和反向代理,以及 IMAP / POP3 代理服务器。Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。 Nginx 的整体架构 Nginx 里有一个 master 进程和多个 worker 进程。master 进程并不处理网络请求,主要负责调度工作进程:加载配置、启动工作进程及非停升级。worker 进程负责处...
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,...
程序员:我终于知道post和get的区别
是一个老生常谈的话题,然而随着不断的学习,对于以前的认识有很多误区,所以还是需要不断地总结的,学而时习之,不亦说乎
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU...
加快推动区块链技术和产业创新发展,2019可信区块链峰会在京召开
11月8日,由中国信息通信研究院、中国通信标准化协会、中国互联网协会、可信区块链推进计划联合主办,科技行者协办的2019可信区块链峰会将在北京悠唐皇冠假日酒店开幕。   区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术。如果说蒸汽机释放了人类的生产力,电力解决了人类基本的生活需求,互联网彻底改变了信息传递的方式,区块链作为构造信任的技术有重要的价值。   1...
Java世界最常用的工具类库
Apache Commons Apache Commons有很多子项目 Google Guava 参考博客
程序员把地府后台管理系统做出来了,还有3.0版本!12月7号最新消息:已在开发中有github地址
第一幕:缘起 听说阎王爷要做个生死簿后台管理系统,我们派去了一个程序员…… 996程序员做的梦: 第一场:团队招募 为了应对地府管理危机,阎王打算找“人”开发一套地府后台管理系统,于是就在地府总经办群中发了项目需求。 话说还是中国电信的信号好,地府都是满格,哈哈!!! 经常会有外行朋友问:看某网站做的不错,功能也简单,你帮忙做一下? 而这次,面对这样的需求,这个程序员...
网易云6亿用户音乐推荐算法
网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。 本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法落地过程中遇到的挑战和解决方案。 将从如下两个部分展开: AI算法在音乐推荐中的应用 音乐场景下的 AI 思考 从 2013 年 4 月正式上线至今,网易云音乐平台持续提供着:乐屏社区、UGC...
【技巧总结】位运算装逼指南
位算法的效率有多快我就不说,不信你可以去用 10 亿个数据模拟一下,今天给大家讲一讲位运算的一些经典例子。不过,最重要的不是看懂了这些例子就好,而是要在以后多去运用位运算这些技巧,当然,采用位运算,也是可以装逼的,不信,你往下看。我会从最简单的讲起,一道比一道难度递增,不过居然是讲技巧,那么也不会太难,相信你分分钟看懂。 判断奇偶数 判断一个数是基于还是偶数,相信很多人都做过,一般的做法的代码如下...
为什么要学数据结构?
一、前言 在可视化化程序设计的今天,借助于集成开发环境可以很快地生成程序,程序设计不再是计算机专业人员的专利。很多人认为,只要掌握几种开发工具就可以成为编程高手,其实,这是一种误解。要想成为一个专业的开发人员,至少需要以下三个条件: 1) 能够熟练地选择和设计各种数据结构和算法 2) 至少要能够熟练地掌握一门程序设计语言 3) 熟知所涉及的相关应用领域的知识 其中,后两个条件比较容易实现,而第一个...
Android 9.0 init 启动流程
阅读五分钟,每日十点,和您一起终身学习,这里是程序员Android本篇文章主要介绍Android开发中的部分知识点,通过阅读本篇文章,您将收获以下内容:一、启动流程概述一、 启动流程概述Android启动流程跟Linux启动类似,大致分为如下五个阶段。1.开机上电,加载固化的ROM。2.加载BootLoader,拉起Android OS。3.加载Uboot,初始外设,引导Kernel启动等。...
相关热词 c# 二进制截断字符串 c#实现窗体设计器 c#检测是否为微信 c# plc s1200 c#里氏转换原则 c# 主界面 c# do loop c#存为组套 模板 c# 停掉协程 c# rgb 读取图片
立即提问