一个程序里能实现爬取的文件保存下来，然后再读取吗？怎么写？

我现在只写好了读取部分，爬取的文件保存下来这部分不知道怎么写。

from bs4 import BeautifulSoup
import requests
import re
import codecs
import urllib.request, http.cookiejar


# 选择给定的任一文件(science.txt、international.txt、military.txt、sports.txt、yuanfudao.txt)读取
f = open('114514.html', 'r', encoding='UTF-8')
html = f.read()
f.close()


# 使用BeautifulSoup功能，利用'html.parser'解析器解析html
soup = BeautifulSoup(html, 'html.parser')
# 使用select功能,通过 类选择器 搜索 class="news_list" 的ul标签,并使用索引[0]取值
all_ul_tag = soup.select('.news_list')[0]
# 使用find_all功能，查找all_ul_tag标签对象中的全部 li 标签对象
all_li_tag = all_ul_tag.find_all('li')
# 使用for循环遍历all_li_tag标签对象
for li in all_li_tag:
    # 使用find功能,查找li标签对象中的img标签对象
    news_image = li.find('img')
    # 使用get功能,获取img标签对象(news_image)的src属性，取出链接
    news_image_link = news_image.get('src')
    # 使用find功能,查找li标签对象中的a标签对象
    news = li.find('a')
    # 使用get功能,获取a标签对象(news)的href属性，取出链接
    news_link = news.get('herf')
    #使用get_text功能,获取a标签对象(news)内的文本信息
    news_name = news.get_text()


    # 使用find_all功能,查找li标签对象中的全部span标签对象
    span_list = li.find_all('span')
    #使用get_text功能,获取span标签对象(span_list)内的文本信息，并使用索引[0]取出“作者”信息
    news_writer = span_list[0].get_text()
    # 使用get_text功能,获取span标签对象(span_list)内的文本信息，并使用索引[1]取出“时间”信息
    news_time = span_list[1].get_text


    #将数据存入一维列表 [news_name, news_writer, news_time, news_link, news_image_link]
    news_item = [news_name, news_writer, news_time, news_link, news_image_link]
    print(news_item)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
碧池阿蒂拉 2021-07-17 03:00
关注
with open('保存路径.html', 'wb') as f: f.write(requests.get('链接').content)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

一个程序里能实现爬取的文件保存下来，然后再读取吗？怎么写？ python 开发语言
2021-07-16 22:12

回答 3 已采纳 with open('保存路径.html', 'wb') as f: f.write(requests.get('链接').content)
微信小程序wxs以及js能不能读取或是更改当前目录下的json文件？ javascript json 微信小程序
2022-02-08 09:16

回答 3 已采纳应该是不能的，js 就不支持读写本地文件的。一般都是服务端完成。比如node,java
java里怎么将一个文件保存至另外一个文件里？ java
2019-11-13 21:57

回答 1 已采纳第一步由用户输入文件路径，那么就可以直接读取该文件的内容，然后写入到一个新文件的话，文件目录可以程序固定就可以了。楼主说的第二步将用户输入的路径对应的文件拷贝到指定文件，应该用 openFile
Pyhton爬取TIOBE编程语言信息
2021-05-07 16:12

HSBhuang的博客简介百度百科 TIOBE排行榜是根据互联网上有经验的...了解了什么是TIOBE，接下来让我们爬取一下TIOBE里面的编程语言排行榜的信息。爬取过程 1、打开TIOBE官网https://www.tiobe.com/tiobe-index/，检查分析页面信息
java代码读取文件夹下所有文件内容，实现读取一个文件处理一个文件！？ java
2018-03-27 02:39

回答 4 已采纳先获取文件，然后对原文件进行读写就可以了 /** * One.txt中的数据如下: * 1 * 2 * 3 * 4 * 5 * --------------
C语言编写一个能计算学生平均成绩并保存为文件的程序。 c# c语言
2022-08-27 23:00

回答 2 已采纳非标准答案，仅供参考！谢谢！ #include<stdio.h> // 打开文件读取各个分数累加到total // 返回学生人数n size_t getsdataTo(FILE *
把一个数组写到二进制文件，然后从文件中读出来？ c++ c语言
2019-04-25 20:53

回答 1 已采纳 ``` #include #include using namespace std; int main() { float data[4]; fstream
如何用Python操作Excel自动化办公？一个案例教会你openpyxl——读取数据
2022-02-06 15:32

DataMiningSharer的博客数据分析工作最难搞的是处理数据的过程，不然不会有专门的ETL（数据抽取、转换、加载）工程师了。...如果数据量比较小、一次性事务处理的话，手动处理Excel表格就好，用程序或软件的话反而比较麻烦。但是如果数据
Java语言程序的编写结果怎么自动保存到dat文件里，并且不得被记事本等软件读取开发语言
2020-05-16 17:25

回答 1 已采纳 Java 提供提供了操作文件的方法，而文件是文件系统的，Java 操作过的文件，其他应用程序都是可以读取的。所以不存在这种情况。
c#中假设我有一个txt文档，怎么做到一个程序写入的同时另一个程序可以读取 c#
2022-03-22 09:44

回答 3 已采纳温馨提示：有其他疑问可加咨询1、效果如下1）在后台执行一个方法，每秒都往txt文件写入信息2）同时在页面定时读取内容 2、代码如下1）后端代码 using Microsoft.AspNetCore.M
读取CSV文件时如何跳过第一行？
2019-07-01 08:14

回答 2 已采纳 skip the first row when reading a csv file For example, package main import ( "bufio"
写一个搜索引擎系统（Java版）
2022-04-03 12:05

Java笔记虾的博客搜索引擎怎么搜索搜索引擎就像一个小蜜蜂每天不停的采摘蜂蜜，就是去爬虫各个网页，然后通过爬取之后建立索引，以供于我们去搜索。这里我们可以使用Python，或者下载文档压缩包。这里我们下包把...
编写一个程序，读取一行输入，然后把输入的内容倒序打印出来。 c语言
2022-03-19 23:26

回答 1 已采纳 while 中 ++i 不能改为 i++ ，作为布尔表达式 ++i 的值等于 i+1 ，而 i++ 的值等于 i ，用 i++ 的话 do-while 循环就只会执行一次。 for 循环用 ; 分开的
python初学爬虫项目一：如何利用requests和selenium模块自动爬取漫画网站的整部漫画？
2020-09-29 02:22

走不尽的人生的博客项目介绍源代码功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表...
python以写模式打开的文件无法进读操作_一文看懂Python IO操作：文件读取、写入都讲明白了-不能打开要写入的文件...
2021-03-17 21:50

戴舜的博客导读：IO在计算机中指的是Input/Output，也就是输入输出。...我们可以把流理解为一个水管，数据相当于水管中的水，但是只能单向流动，所以数据传输过程中需要架设两个水管，一个负责输入，一个负责输出，这样...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月16日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

一个程序里能实现爬取的文件保存下来，然后再读取吗？怎么写？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新