批量提取多个txt文本中的数据，并将这些数据存入新的txt文本中，该怎么实现？

批量提取多个txt文本中的数据，并将这些数据存入新的txt文本中，该怎么实现？
如图是文件夹中的txt文件

下图红线框内是需要提取的数据

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-07-21 02:04

关注

你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7477709
我还给你找了一篇非常好的博客，你可以看看是否有帮助，链接：读取txt文件中某些行并存入另一个txt文件
除此之外, 这篇博客: 将图片按txt格式进行存储，对txt文件批量读取中的 将图片存储为txt文件代码 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

'''
本代码以UC数据集为例子，UC数据集共包含21类，每一类图片包含100张图片
其中class_label_dict为UC数据集label，
'''
import numpy as np
import os


class_label_dict = {'agricultural': 0,
                   "airplane": 1,
                   "baseballdiamond": 2,
                   "beach": 3,
                   "buildings": 4,
                   "chaparral": 5,
                   "denseresidential": 6,
                   "forest": 7,
                   "freeway": 8,
                   "golfcourse": 9,
                   "harbor": 10,
                   "intersection": 11,
                   "mediumresidential": 12,
                   "mobilehomepark": 13,
                   "overpass": 14,
                   "parkinglot": 15,
                   "river": 16,
                   "runway": 17,
                   "sparseresidential": 18,
                   "storagetanks": 19,
                   "tenniscourt": 20
                   }
file_path = "G:/UC"                                  #此处为文件存放位置
path_list = os.listdir(file_path)                 #会历遍文件夹内的文件并返回一个列表
path_name=[]

for i in path_list:
   path_name.append(file_path+"/"+i+" "+str(class_label_dict[i[:-6]]))

# 排序一下
path_name.sort()


train_path = []
test_path = []
trains_idx = []
tests_idx = []
for i in range(21):
   start = i * 100
   end = (i + 1) * 100
   idx = np.arange(start, end)
   np.random.shuffle(idx)
   train_idx = idx[0:80]
   test_idx = idx[80:]
   trains_idx.extend(train_idx)
   tests_idx.extend(test_idx)
path_name = np.array(path_name)
train_path = path_name[trains_idx]
test_path = path_name[tests_idx]
for file_name in path_name:
   # "a"表示以不覆盖的形式写入到文件中,当前文件夹如果没有"save.txt"会自动创建
   with open("data.txt", "a") as f:
       f.write(file_name + "\n")
   f.close()

for file_name in train_path:
   # "a"表示以不覆盖的形式写入到文件中,当前文件夹如果没有"save.txt"会自动创建
   with open("train.txt", "a") as f:
       f.write(file_name + "\n")
   f.close()
for file_name in test_path:
   # "a"表示以不覆盖的形式写入到文件中,当前文件夹如果没有"save.txt"会自动创建
   with open("test.txt", "a") as f:
       f.write(file_name + "\n")
   f.close()

输出txt文件的格式为文件位置+文件名+label形式，如下图所示：
在这里插入图片描述

报告相同问题？

关注问题

python将一个文件中的所有图片的名称放入一个.txt文件中
2023-03-22 10:11

还明的博客 python将一个文件中的所有图片的名称放入一个.txt文件中
Python爬虫实战：手把手教你如何自动化采集博客园精华文章并存储至 SQLite 数据库！
2026-03-09 16:07

喵手的博客我长期专注 Python 爬虫工程化实战，主理专栏《Python爬虫实战》：从采集策略到反爬对抗，从数据清洗到分布式调度，持续输出...内容主打一个“能跑、能用、能扩展”，让数据价值真正做到——抓得到、洗得净、用得上。
shell脚本基础
2021-03-24 17:32

西红柿炒蛋加立白的博客 Shell 是一个用 C 语言编写的程序，Shell 既是一种命令语言，也是一个编程语言。 shell是一种解释型语言，解释型语言的特征就是有一个能编写代码的文本编辑器和一个能解释执行的脚本解释器就可以运行，其运行时逐行...
python → 函数的实际应用
2023-06-09 18:45

圆弧创意的博客遍历os 遍历文件夹中的所有文件，并将信息输入到xlsx中，可用如下代码： #下面代码，实现将电脑文件夹中的所有文件信息输出到xlsx文件中 import os import openpyxl mypath=input("请输入文件夹所在位置：") #...
九款个人知识管理工具介绍
2012-11-16 23:49

静水流深_0321的博客 PKM2 将这些资料全部保存到你的项目中进行管理，不会因系统或软件崩溃丢失数据。PKM2 可以帮助您进行基于内容的采集、编辑、整理、检索、发布，为您的个人知识管理提供有力支持。PKM2 适用于程序员
Excel 电子表格运用技巧汇总
2008-05-30 16:10

移动互联网个体户的博客 Excel XP的八则快速输入技巧　如果我们在用Excel XP处理庞大的数据信息时，不注意讲究技巧和方法的话，很可能会花费很大的精力。因此如何巧用Excel XP，来快速输入信息就成为各个Excel XP用户非常关心的话题，笔者向...
Qwen1.5-1.8B GPTQ实战：利用爬虫技术构建模型训练数据清洗管道
2026-03-25 00:50

tianjiaxiaoer的博客本文介绍了如何利用星图GPU平台自动化部署 Qwen1.5-1.8B GPTQ镜像，...该方案结合网络爬虫技术，使用该模型对从技术社区抓取的原始文本进行智能清洗、去重和关键信息提取，高效生成可用于AI模型训练的高质量数据集。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月21日

批量提取多个txt文本中的数据，并将这些数据存入新的txt文本中，该怎么实现？

1条回答 默认 最新

问题事件

1条回答默认最新