球问爬取到的数据怎么保存到本地文件

from bs4 import BeautifulSoup
import requests
userSeach='pr'
page=1
viedoNum=0
val=0
mainUrl='https://search.bilibili.com/all?keyword=%27+userSeach
mainSoup = BeautifulSoup(requests.get(mainUrl).text, "html.parser")
pages=mainSoup.find('li',class_="page-item last")
with open('test.txt', 'w', encoding='utf-8') as f:
if(pages):
pages=int(pages.text)
else:
pages=1
while page<=pages:
mainUrl='https://search.bilibili.com/all?keyword=%27+userSeach+%27&page=%27+page.__str__()
mainSoup = BeautifulSoup(requests.get(mainUrl).text, "html.parser")
for item in mainSoup.find_all('li',class_="video-item matrix"):
viedoNum += 1
print('第'+ viedoNum.str() + '个视频:')
val=item.find('a',class_="img-anchor")
print('视频标题:'+ val["title"])
print('视频链接:'+'https:'+val["href"])
print('视频简介:'+item.find('div',class_="des hide").text.strip())
print('up主:'+ item.find('a',class_="up-name").text.strip())
print('视频观看量:'+ item.find('span',title='观看').text.strip())
print('弹幕量:'+ item.find('span',title='弹幕').text.strip())
print('上传时间:'+ item.find('span',title='上传时间').text.strip())
subUrl=val["href"];
subSoup = BeautifulSoup(requests.get('https:'+subUrl).text.strip(), "html.parser")
print('视频图片:'+subSoup.find(itemprop="image")["content"])
page+=1
f.write()

txt和CSV的方式都可以，怎么改呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
於黾 2022-06-14 13:27
关注
你要把f.write放到open里面去啊

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python3实现爬取指定百度贴吧页面并保存页面数据生成本地文档的方法
2020-09-20 14:11

该函数首先将用户输入的贴吧名进行URL编码，然后按照百度贴吧的分页规则（pn参数的值表示页码的起点）拼接成完整的URL，并使用前面定义的loadPage函数按页面号顺序爬取数据，最后调用write函数将数据写入本地文件。...
使用Python爬取小说并保存到本地！
2025-02-09 15:17

Python_trys的博客在本文中，我们将介绍如何使用Python编写一个简单的网络爬虫，从网站上爬取小说内容并保存到本地文件中。我们将使用requests库来发送HTTP请求，使用BeautifulSoup库来解析HTML内容，并使用正则表达式来提取小说章节...
python爬取w3shcool的JQuery课程并且保存到本地
2020-09-21 08:59

在本教程中，我们将探讨如何使用Python爬虫技术从w3school网站抓取JQuery的课程内容并将其保存到本地。w3school是一个知名的在线学习平台，提供了丰富的编程语言和框架的教学资源，包括JQuery。这里，我们主要关注...
基于Java语言的京东网站数据爬取设计源码
2024-09-30 10:25

在本项目中，爬取到的数据可能被导出到这样的文件中，以便进一步分析和处理。 Markdown文件和YAML配置文件则分别用于编写项目文档和项目配置。Markdown文件的简洁性和易读性使其成为编写项目文档的理想选择。而YAML...
基于java爬取网络图片并且保存到本地
2018-06-06 16:44

这个项目“基于Java爬取网络图片并且保存到本地”旨在为初学者提供一个学习实践的机会，了解如何利用Java进行网页抓取和数据处理。首先，我们需要了解Java爬虫的基础。这通常涉及以下几个关键概念： 1. **HTTP...
知乎问题的爬取（保存到一个txt文件中）.rar
2021-05-26 17:38

然后，可以使用requests库的get()方法下载图片，将其保存到本地文件系统。但是，考虑到图片的处理涉及版权和服务器负载问题，实际操作时应确保遵循网站的robots.txt协议，并在必要时进行延迟或限速设置。总的来说...
【python】爬取4K壁纸保存到本地文件夹【附源码】
2024-04-18 11:00

黑客老六的博客函数用来下载图片到本地存储。在部分：定义函数用于获取图片链接：发送GET请求获取网页内容。将网页内容转换为etree对象以便后续使用xpath进行解析。使用xpath定位所有的li标签，并遍历每个li标签获取图片
使用 Python 爬取天气数据并保存至 CSV
2024-04-19 10:35

清河大善人的博客天气数据是我们生活中非常重要的一部分。它不仅影响着我们的出行计划，还直接影响到农业、...因此，我们可以利用网络爬虫技术，通过编写程序从天气网站上获取历史天气数据，并将其保存至本地文件，以备后续分析和使用。
爬取豆瓣动作电影的json数据，做自己的数据集
2024-11-03 20:58

一般来说，小型的数据集可以直接保存在本地文件系统中，如使用.json格式保存。对于大型的数据集，则可能需要考虑使用数据库系统，如MySQL、MongoDB等。使用数据库可以方便数据的存储、检索和更新操作，也有利于数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月14日

球问爬取到的数据怎么保存到本地文件

1条回答 默认 最新

问题事件

1条回答默认最新