如何将单个文件读取更改为循环语句

大家好，我目前正在做删除停词的任务，这个代码可以运行，想请教如何改成循环语句，即循环提取文件夹内停词，而不是单个单个的文件。应该是改“file1....这个语句，但不知道如何改。谢谢大家！

import io
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

stop_words = set(stopwords.words('english'))
file1 = open(
    r"D:\1.1 SEC EDGAR年报源文件 (10Q_10KA_10QA)\2001\QTR1\20010102_10-K-A_edgar_data_1024302_0001092388-00-500453.txt")
line = file1.read()
words = word_tokenize(line)
words_witout_stop_words = ["" if word in stop_words else word for word in words]
new_words = " ".join(words_witout_stop_words).strip()
appendFile = open(
    r"D:\1.1 SEC EDGAR年报源文件 (10Q_10KA_10QA)\2001\QTR1\20010102_10-K-A_edgar_data_1024302_0001092388-00-500453.txt", 'w')
appendFile.write(new_words)
appendFile.close()

谢谢大家！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

陈年椰子 2022-03-07 08:18

关注

大概就是这样，把文件处理改成一个过程，加一个遍历文件夹的过程。

import io
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
import os

# 把文件处理改成一个过程
def file_work(file_name):
    stop_words = set(stopwords.words('english'))
    file1 = open( file_name)
    line = file1.read()
    words = word_tokenize(line)
    words_witout_stop_words = ["" if word in stop_words else word for word in words]
    new_words = " ".join(words_witout_stop_words).strip()
    appendFile = open(file_name, 'w')
    appendFile.write(new_words)
    appendFile.close()

# 这个是完成1个文件
f =  r"D:\1.1 SEC EDGAR年报源文件 (10Q_10KA_10QA)\2001\QTR1\20010102_10-K-A_edgar_data_1024302_0001092388-00-500453.txt"
file_work(f)





def check_all_files(check_path):
    list_files = []
    # 列出文件夹下所有的目录与文件
    cur_list = os.listdir(check_path)
    for i in range(0 ,len(cur_list)):
        file_path = os.path.join(check_path, cur_list[i])
        if os.path.isdir(file_path):
            list_files.extend(check_all_files(file_path))
        if os.path.isfile(file_path):
            # print(cur_list[i][-4:].upper())
            if cur_list[i][-3:].upper()=='TXT':
                list_files.append([cur_list[i], file_path])
    return list_files


# 遍历文件夹 处理所有txt文件
txt_file = check_all_files( r"D:\1.1 SEC EDGAR年报源文件 (10Q_10KA_10QA)")
for f in txt_file:
    print("处理",f[0])
    file_work(f[1])

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

如何将单个文件读取更改为循环语句 python
2022-03-07 01:18

回答 1 已采纳大概就是这样，把文件处理改成一个过程，加一个遍历文件夹的过程。 import io from nltk.corpus import stopwords from nltk.tokenize
python写入excel文件中单个单元格换行问题 python
2022-12-09 09:15

回答 2 已采纳得对单元格对象设置自动换行。 cell.alignment=Alignment(wrapText=True)
python 文件操作循环判断数据处理 python 正则表达式
2022-04-07 17:02

回答 1 已采纳 import re f = open("data.txt", "r") d = {} for line in f.readlines()[1:]: # 去除空行,当不给split函数传递任
python bin文件读写_Python读写文件
2021-01-15 00:11

ac32168的博客给要打开的文件对象指定一个名字，这样可在完成操作之后迅速关闭文件，防止一些无用的文件对象占用内存Python读写文件的五大步骤一、打开文件Python读写文件在计算机语言中被广泛的应用，如果你想了解其应用的程序，...
怎么用python读取labelme标注后的json文件？ python 有问必答深度学习神经网络
2022-03-16 23:23

回答 3 已采纳和读取字典一样的格式就是了，json读取完毕就是一整个字典了.给你个大致脚本，如果你自己根据json_dict的key值用字典方式遍历就是了。 import json json_file="1.jso
python用单个while循环计算乘积 python
2021-10-31 17:52

回答 2 已采纳第一空：prod第二空：99第三空：2最终代码： prod=1 i=99 while i>0: prod*=i i-=2 print(prod)
Python如何将重复字符替换成单个字符替换？ python
2022-03-20 07:42

回答 4 已采纳 def res_dup(text: str): new_text = sorted(set(text)) result = "".join(new_text) return
python os读取文件内容_python基础之文件读写
2020-12-11 12:02

weixin_39883208的博客 python基础之文件读写本节内容os模块中文件以及目录的一些方法文件的操作目录的操作1.os模块中文件以及目录的一些方法python操作文件以及目录可以使用os模块的一些方法如下：得到当前工作目录，即当前Python脚本工作...
pycharm 编译单个语句时发现多个语句错误如何解决 pycharm python 爬虫
2022-03-11 00:24

回答 2 已采纳 print(resp.read())
Python读取csv文件后str转换为float python
2018-02-02 08:39

回答 4 已采纳 >>> a="-1" >>> float(a) -1.0 >>> a="-" >>> float(a) Traceba
利用python将表格转换为三元组 python
2022-02-07 22:37

回答 2 已采纳 import pandas as pd def fun(series, cols): lst = series.tolist() lstr = [] for row in z
python的循环语句例题,python循环语句 题库
2024-03-23 13:27

chatgpt002的博客大家好，本文将围绕python的循环语句例题展开说明，python循环语句 题库是一个很多人都想弄明白的事情，想搞清楚python经典循环题目需要先了解以下几个事情。学习永远都是“理论”与“实践”相结合效果最好。这里有...
python访问单个/范围内字符 python
2022-06-15 10:52

回答 1 已采纳你前面的理解没有问题，但是你没能类比一下。访问list和字符串都是用的索引。python的索引是从0开始的。就是说，a=【1，2，3】中，1的索引是0, a【0】就是1，这个看着很别扭，但是你要理解。
python中循环语句的用法,python几种循环方式
2022-09-17 19:13

goodutils的博客例如：字符串、列表、字典、元组和集合for循环里面有一个隐藏的机制，就是自动执行index+1，直到遍历完整个序列基本语法Python的设计目标之一是让代码具备高度的可阅读性。遍历列表，字典之类，就适合for循环。
python循环语句计算_[15] Python循环语句（二）
2020-12-13 13:52

weixin_39677027的博客 1. 概述今天我们继续来看循环语句，主要介绍赋值运算符、无限循环和for循环语句。计算机编程的原理简要介绍集成开发环境PyCharm变量名、数字、字符串、列表句式、注释输入和输出条件判断语句循环语句各类数据结构...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月7日

悬赏问题

¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测

如何将单个文件读取更改为循环语句

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新