如何用python读取TXT文件的特定内容

图片说明

如图,TXT文件里的每段内容都是以PT P开始,ER结束,怎样提取每段内容里PN,TI,AU 后的数据

2个回答

我的想法是:每次读取一行,使用正则表达式匹配PN、TI所在的行(PN、TI后面的数据都在一行上),之后使用字符串切片提取后面的内容。
至于提取AU后面的数据,则使用正则表达式匹配AU至ER的内容,再使用切片提取。

text = open(r'C:\1.txt').read()
r=re.findall('PT P\nPN ([\S\s]*?)\nTI ([\S\s]*?)\nAU ([\S\s]*?)ER',text)
print(r)

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python读取文本文件的特定内容

图片是一个数据集片段,如何写一段Python代码,提取文件中的id和text,如 3606464114611322 【中国一村庄上百村民移民澳大利亚 靠做电焊工拿绿卡】月入两三万,住200多平方米的房子…… 3606464897589553 #小午快报#【济南一个201户的村庄有100多村民移民澳大利亚】 3606465602473943 河南商报: 【济南有个村儿:100多名村民移民澳大利亚】 ![图片说明](https://img-ask.csdn.net/upload/201704/10/1491806376_581740.png)

【python】用python读取txt并按规则写入excle

![图片说明](https://img-ask.csdn.net/upload/201903/28/1553756964_633544.jpg) 对于这个问题,我写的代码是这样的 ``` # coding: utf-8 import csv TITLE = "【来源篇名】" AUTHOR = "【来源作者】" ORG = "【第一机构】" KEYWORD = "【关 键 词】" REFER = "【参考文献】" # By WilliamsCarl。2019/3/24 2:21。 # 作者:王木槿天下第一。Copyright. item_start = True refer_start = False headers = [TITLE, AUTHOR, ORG, KEYWORD, REFER] items = [] with open('E:\\textOut.txt', encoding='gbk') as f: row = { 'refer': [] } for line in f.readlines(): line = line.strip() # if not line: # continue if TITLE in line: column = 0 tl = line.split(TITLE)[1] refer_start = False row['tl'] = tl if AUTHOR in line: column = 1 au = line.split(AUTHOR)[1] row['au'] = au if ORG in line: column = 2 og = line.split(ORG)[1] row['og'] = og if KEYWORD in line: column = 3 kw = line.split(KEYWORD)[1] row['kw'] = kw if REFER in line: refer_start = True continue if refer_start: row['refer'].append(line) if refer_start and (not line): refer_start = False item = [row['tl'], row['au'], row['og'], row['kw']] for r in row['refer']: item.append(r) items.append(item) row = { 'refer': [] } with open('E:\\result.csv','w') as c: f_csv = csv.writer(c) f_csv.writerow(headers) f_csv.writerows(items) ``` **目前的问题是, 比如【来源篇名】某一组不存在,他就会说keyerror,** ![图片说明](https://img-ask.csdn.net/upload/201903/28/1553757557_16466.png) **当我将 i= [row['tl'], row['au'], row['og'], row['kw']] 变成row.setdefult,他的过滤又将一些存在的东西过滤掉了,如下图,** ![图片说明](https://img-ask.csdn.net/upload/201903/28/1553758231_316518.png) ![图片说明](https://img-ask.csdn.net/upload/201903/28/1553758055_824889.png) ![图片说明](https://img-ask.csdn.net/upload/201903/28/1553758108_472763.png)

如何用sypder读取txt文件中的某三列数据并对其判断运算

我想用Spyder读取txt文件中的某三列数据并对其判断运算![图片说明](https://img-ask.csdn.net/upload/201905/13/1557734449_708902.png) 这是文件中的数据,我想读取var5-var7这三列的数据,判断前两列经纬度是否为我想要的范围,如果是则计算出所有符合要求的速度(var7列数据)的平均值,请问如何解决啊?

Python 删除TXT文件的指定行

问下Python 中读取TXT文件的每一行,匹配有例如:rating的行就删除该行或者将rating替换为avg也可以,怎么写啊? (该文本中的每行都有空格,开头也可能有空格),谢谢啦,嘿嘿

Python读取一个文件夹里多个txt文件里的所有数据

当一个文件夹下面有600个txt数据文件,每个txt文件里都是第一行是变量名,从第2行开始是数据,大概100行左右,共23列,想要把这600个文件里的数据都导入到pycharm中,不知道只用array还是dataframe比较合适呢??虽然感觉这个问题很简单,但我真的操作起来好难的,求解!!!在线等

问下Python 中删除TXT文件的指定行

问下Python 中读取TXT文件的每一行,匹配有例如:rating的行就删除该行或者将rating替换为avg也可以,怎么写啊? (该文本中的每行都有空格,开头也可能有空格),谢谢啦,嘿嘿

python删除txt指定内容

![图片说明](https://img-ask.csdn.net/upload/202003/10/1583844942_709021.png) 我想删除车牌号前所有内容,只保留车牌hao,如何做,求大佬答疑解惑

python使用elementTree如何读取xml文件标签嵌套中的文本。

``` <text top="310" left="449" width="347" height="16" font="1"> <i>Fig. 1.</i> Training with brain computer interface–neuromuscular electrical </text> ``` ``` <text top="310" left="449" width="347" height="16" font="1"> Training with brain computer <i>Fig. 1.</i> interface–neuromuscular electrical </text> ``` 上述是xml文件中的一部分,如何用python处理像这样大标签文本中嵌入着子标签,从而读取到完整的文本内容? 子标签如果在文本开头的话,直接输出.text会输出None; 子标签如果在文本中间的话,就会只输出前半部分(即Training with brain computer)。 有没有什么办法能输出完整的文本, 即Fig. 1.Training with brain computer interface–neuromuscular electrical 和 Training with brain computer Fig. 1. interface–neuromuscular electrical 这两种结果?求大神指点。。。

求教!如何在python中删除txt中指定的一些数值

比如要处理的文件为Data.txt,内容如下: 1 2 3 4 444 444 63 67 66 33 44 67 22 21 444 67 42 1 2 3 5 7 3 4 6 7 8 4 5 72 78 5 67 8 9 95 指定要删除的数字如下: 2 4 7 5 要求删除后生成的新的Data文件为: 1 3 444 444 63 67 66 33 44 67 22 21 444 67 42 1 3 3 4 6 8 4 72 78 67 8 9 95 也就是把Data.txt中涉及的数字删掉,不影响别的数值

python中如何将文件中的内容转换为列表?

比如说文件为a.txt,内容为['1', '2', '3'],如何将其内容读出来并赋值给一个列表list呢? 本人采用如下法子,得出的结果却是这样子的 >>> li=[] >>> f=open("c:\\bar\\a.txt","rb") >>> li=f.read().split(",") >>> li [color=red]["['1'", " '2'", " '3']"][/color] 想让li的内容和文件的内容一模一样哇,求大牛帮解答,谢谢啦

Python读取符合一定条件的Excel数据,复制到文本文件中

大神们,求助,求助 Python初学者,尝试利用Python遍历读取Excel中B列的数据,并以其数据对应为文本文件名称,同时,复制Excel中A列的数值到对应的文本文件

如何用matlab批量读取多个txt文件中指定行的内容

有60个txt文件,每个txt文件中并不是纯数据,开头含有字母,如下图所示 。我需要的是每个文件中的第6行的数据,就是读取这一行的数据,然后将60个文件中的VV开头一行的数据全部放到一个数组!当中。请问如何编写这样的程序,挺急的,希望高人指点。某一个TXT的文件内容如下(最好是用matlab)![图片说明](https://img-ask.csdn.net/upload/201906/01/1559380501_89665.png)

python 遍历文件中的关键词

用python遍历指定文件夹下的所有文件内容, 输入一个中文关键词,得到所有txt文件中关键词出现的次数

如何用Python在指定文件中查询关键字,并显示关键词前后一定范围的内容?

用Python从《巴菲特自传》文本中查询所有的“巴菲特”,查询结果为其前后“前20个字+巴菲特+后20个字”,每个结果一行。

Python 怎样提取excel文件中某一行中的特定内容?

![图片说明](https://img-ask.csdn.net/upload/201812/01/1543640683_855860.png) 如图,怎样把每一行中划红线的部分提取出来?

python,如何提取文件中指定行的信息?

txt中有姓名,上班,下班,打卡时间。如:liudehua,上班时间:2017:11:12:20:00,下班时间....,中间还有其他信息,我只需要过滤上述信息,求大神指导。注::有中文

python如何抽取txt文件中用tab分隔的第一个字符串并去重?

环境:python3 现有一个三元组的txt文件,每个三元组占一行,实体和属性用tab键隔开; 如何抽取出每一行的第一个实体并将其写入一个txt,一个实体占一行。数据量比较大大概6500万条 我这么写的,是不是正则表达式的问题? ```python import datetime import re start_time = datetime.datetime.now() print("start time:", start_time) count = 1 f = open(r'D:\bishe_data\test.txt',encoding='utf-8',mode='r') line = f.readline() while line != "": s = re.split('^[^\s]+/t'',' ',data) print(s) line = f.readline() f.close() end_time = datetime.datetime.now() print("end_time:", end_time) print("during:", end_time - start_time) print(count) ``` 求大神解答!!

文件夹下txt批量提取列并处理

新手求教,处理数据时使用(急),在网上搜索并尝试无果,请问如何通过python或bat实现以下目标: 1.对文件夹下的所有txt文件批量提取某几列数据(不相邻),并分别放入与原文件名对应的txt内(文本名为“原文本名+tm”); 2.对提取后的txt中某列数据进行运算:原数据×0.1;及特征数字数据替换; 以一个txt为例描述: 如图示,提取第6、7、8、10列数据至新的txt文本,文本名为50136tn;对第10列数据进行“×0.1”运算,并将32766数值替换为99999。 ![图片说明](https://img-ask.csdn.net/upload/202004/01/1585711952_950608.png) 不胜感激!

如何用shell脚本读取文件指定内容?

![图片说明](https://img-ask.csdn.net/upload/201703/23/1490257628_713793.jpg)

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解!

CSDN:因博主近期注重写专栏文章(已超过150篇),订阅博主专栏人数在突增,近期很有可能提高专栏价格(已订阅的不受影响),提前声明,敬请理解! 目录 博客声明 大数据了解博主粉丝 博主的粉丝群体画像 粉丝群体性别比例、年龄分布 粉丝群体学历分布、职业分布、行业分布 国内、国外粉丝群体地域分布 博主的近期访问每日增量、粉丝每日增量 博客声明 因近期博主写专栏的文章越来越多,也越来越精细,逐步优化文章。因此,最近一段时间,订阅博主专栏的人数增长也非常快,并且专栏价

我说我不会算法,阿里把我挂了。

不说了,字节跳动也反手把我挂了。

培训班出来的人后来都怎么样了?(二)

接着上回说,培训班学习生涯结束了。后面每天就是无休止的背面试题,不是没有头脑的背,培训公司还是有方法的,现在回想当时背的面试题好像都用上了,也被问到了。回头找找面试题,当时都是打印下来天天看,天天背。 不理解呢也要背,面试造飞机,上班拧螺丝。班里的同学开始四处投简历面试了,很快就有面试成功的,刚开始一个,然后越来越多。不知道是什么原因,尝到胜利果实的童鞋,不满足于自己通过的公司,嫌薪水要少了,选择...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

工作八年,月薪60K,裸辞两个月,投简历投到怀疑人生!

近日,有网友在某职场社交平台吐槽,自己裸辞两个月了,但是找工作却让自己的心态都要崩溃了,全部无果,不是已查看无回音,就是已查看不符合。 “工作八年,两年一跳,裸辞两个月了,之前月薪60K,最近找工作找的心态崩了!所有招聘工具都用了,全部无果,不是已查看无回音,就是已查看不符合。进头条,滴滴之类的大厂很难吗???!!!投简历投的开始怀疑人生了!希望 可以收到大厂offer” 先来看看网...

97年世界黑客编程大赛冠军作品(大小仅为16KB),惊艳世界的编程巨作

这是世界编程大赛第一名作品(97年Mekka ’97 4K Intro比赛)汇编语言所写。 整个文件只有4095个字节, 大小仅仅为16KB! 不仅实现了3D动画的效果!还有一段震撼人心的背景音乐!!! 内容无法以言语形容,实在太强大! 下面是代码,具体操作看最后! @echo off more +1 %~s0|debug e100 33 f6 bf 0 20 b5 10 f3 a5...

不要再到处使用 === 了

我们知道现在的开发人员都使用 === 来代替 ==,为什么呢?我在网上看到的大多数教程都认为,要预测 JavaScript 强制转换是如何工作这太复杂了,因此建议总是使用===。这些都...

什么是a站、b站、c站、d站、e站、f站、g站、h站、i站、j站、k站、l站、m站、n站?00后的世界我不懂!

A站 AcFun弹幕视频网,简称“A站”,成立于2007年6月,取意于Anime Comic Fun,是中国大陆第一家弹幕视频网站。A站以视频为载体,逐步发展出基于原生内容二次创作的完整生态,拥有高质量互动弹幕,是中国弹幕文化的发源地;拥有大量超粘性的用户群体,产生输出了金坷垃、鬼畜全明星、我的滑板鞋、小苹果等大量网络流行文化,也是中国二次元文化的发源地。 B站 全称“哔哩哔哩(bilibili...

终于,月薪过5万了!

来看几个问题想不想月薪超过5万?想不想进入公司架构组?想不想成为项目组的负责人?想不想成为spring的高手,超越99%的对手?那么本文内容是你必须要掌握的。本文主要详解bean的生命...

MySQL性能优化(五):为什么查询速度这么慢

前期回顾: MySQL性能优化(一):MySQL架构与核心问题 MySQL性能优化(二):选择优化的数据类型 MySQL性能优化(三):深入理解索引的这点事 MySQL性能优化(四):如何高效正确的使用索引 前面章节我们介绍了如何选择优化的数据类型、如何高效的使用索引,这些对于高性能的MySQL来说是必不可少的。但这些还完全不够,还需要合理的设计查询。如果查询写的很糟糕,即使表结构再合理、索引再...

用了这个 IDE 插件,5分钟解决前后端联调!

点击上方蓝色“程序猿DD”,选择“设为星标”回复“资源”获取独家整理的学习资料!作者 |李海庆我是一个 Web 开发前端工程师,受到疫情影响,今天是我在家办公的第78天。开发了两周,...

大厂的 404 页面都长啥样?最后一个笑了...

每天浏览各大网站,难免会碰到404页面啊。你注意过404页面么?猿妹搜罗来了下面这些知名网站的404页面,以供大家欣赏,看看哪个网站更有创意: 正在上传…重新上传取消 腾讯 正在上传…重新上传取消 网易 淘宝 百度 新浪微博 正在上传…重新上传取消 新浪 京东 优酷 腾讯视频 搜...

【高并发】高并发秒杀系统架构解密,不是所有的秒杀都是秒杀!

网上很多的文章和帖子中在介绍秒杀系统时,说是在下单时使用异步削峰来进行一些限流操作,那都是在扯淡! 因为下单操作在整个秒杀系统的流程中属于比较靠后的操作了,限流操作一定要前置处理,在秒杀业务后面的流程中做限流操作是没啥卵用的。

自从喜欢上了B站这12个UP主,我越来越觉得自己是个废柴了!

不怕告诉你,我自从喜欢上了这12个UP主,哔哩哔哩成为了我手机上最耗电的软件,几乎每天都会看,可是吧,看的越多,我就越觉得自己是个废柴,唉,老天不公啊,不信你看看…… 间接性踌躇满志,持续性混吃等死,都是因为你们……但是,自己的学习力在慢慢变强,这是不容忽视的,推荐给你们! 都说B站是个宝,可是有人不会挖啊,没事,今天咱挖好的送你一箩筐,首先啊,我在B站上最喜欢看这个家伙的视频了,为啥 ,咱撇...

代码注释如此沙雕,会玩还是你们程序员!

某站后端代码被“开源”,同时刷遍全网的,还有代码里的那些神注释。 我们这才知道,原来程序员个个都是段子手;这么多年来,我们也走过了他们的无数套路… 首先,产品经理,是永远永远吐槽不完的!网友的评论也非常扎心,说看这些代码就像在阅读程序员的日记,每一页都写满了对产品经理的恨。 然后,也要发出直击灵魂的质问:你是尊贵的付费大会员吗? 这不禁让人想起之前某音乐app的穷逼Vip,果然,穷逼在哪里都是...

Java14 新特性解读

Java14 已于 2020 年 3 月 17 号发布,官方特性解读在这里:https://openjdk.java.net/projects/jdk/14/以下是个人对于特性的中文式...

爬虫(101)爬点重口味的

小弟最近在学校无聊的很哪,浏览网页突然看到一张图片,都快流鼻血。。。然后小弟冥思苦想,得干一点有趣的事情python 爬虫库安装https://s.taobao.com/api?_ks...

疫情后北上广深租房价格跌了吗? | Alfred数据室

去年3月份我们发布了《北上广深租房图鉴》(点击阅读),细数了北上广深租房的各种因素对租房价格的影响。一年过去了,在面临新冠疫情的后续影响、城市尚未完全恢复正常运转、学校还没开学等情况下...

面试官给我挖坑:a[i][j] 和 a[j][i] 有什么区别?

点击上方“朱小厮的博客”,选择“设为星标”后台回复&#34;1024&#34;领取公众号专属资料本文以一个简单的程序开头——数组赋值:int LEN = 10000; int[][] ...

又一起程序员被抓事件

就在昨天互联网又发生一起让人心酸的程序员犯罪事件,著名的百度不限速下载软件 Pandownload PC 版作者被警方抓获。案件大致是这样的:软件的作者不仅非法盗取用户数据,还在QQ群进...

应聘3万的职位,有必要这么刁难我么。。。沙雕。。。

又一次被面试官带到坑里面了。面试官:springmvc用过么?我:用过啊,经常用呢面试官:springmvc中为什么需要用父子容器?我:嗯。。。没听明白你说的什么。面试官:就是contr...

太狠了,疫情期间面试,一个问题砍了我5000!

疫情期间找工作确实有点难度,想拿到满意的薪资,确实要点实力啊!面试官:Spring中的@Value用过么,介绍一下我:@Value可以标注在字段上面,可以将外部配置文件中的数据,比如可以...

Intellij IDEA 美化指南

经常有人问我,你的 IDEA 配色哪里搞的,我会告诉他我自己改的。作为生产力工具,不但要顺手而且更要顺眼。这样才能快乐编码,甚至降低 BUG 率。上次分享了一些 IDEA 有用的插件,反...

【相亲】96年程序员小哥第一次相亲,还没开始就结束了

颜值有点高,条件有点好

太厉害了,终于有人能把TCP/IP 协议讲的明明白白了

一图看完本文 一、 计算机网络体系结构分层 计算机网络体系结构分层 计算机网络体系结构分层 不难看出,TCP/IP 与 OSI 在分层模块上稍有区别。OSI 参考模型注重“通信协议必要的功能是什么”,而 TCP/IP 则更强调“在计算机上实现协议应该开发哪种程序”。 二、 TCP/IP 基础 1. TCP/IP 的具体含义 从字面意义上讲,有人可能会认为...

腾讯面试题: 百度搜索为什么那么快?

我还记得去年面腾讯时,面试官最后一个问题是:百度/google的搜索为什么那么快? 这个问题我懵了,我从来没想过,搜素引擎的原理是什么 然后我回答:百度爬取了各个网站的信息,然后进行排序,当输入关键词的时候进行文档比对……巴拉巴拉 面试官:这不是我想要的答案 我内心 这个问题我一直耿耿于怀,终于今天,我把他写出来,以后再问,我直接把这篇文章甩给他!!! 两个字:倒排,将贯穿整篇文章,也是面试官...

相关热词 c# 按行txt c#怎么扫条形码 c#打包html c# 实现刷新数据 c# 两个自定义控件重叠 c#浮点类型计算 c#.net 中文乱码 c# 时间排序 c# 必备书籍 c#异步网络通信
立即提问