为什么爬取豆瓣top250得到是的是个空列表啊

# import requests
# from bs4 import BeautifulSoup

# #网页爬取
# def getHtml(url):
#     r=requests.get(url)
#     r.encoding='utf-8'
#     return r.text
# #parserHtml()函数为网页内容解析函数
#  #数据解析
# def parserHtml(html,name,attrs):
#     result=[]
#     soup=BeautifulSoup(html,"html.parser")
#     data=soup.find_all(name,attrs)
#     for i in data:
#         info=[]
#         file_name=i.find("span",{'class':"title"})
#         #在每一个name标签中找第一个span标签
#         score=i.find('span',{'class':'rating_num'})#找第一个class标签
#         #for j in tagA:
#         info.append(file_name.string)
#         info.append(score.string)
#         result.append(info)
#     return result 
#数据储存
# import csv
# def writeFile(data,filename):
#     save_path=save_path="./"+filename
#     with open(save_path,'a',errors='ignore',newline='')as fd:
#         f_csv=csv.writer(fd)
#         f_csv.writerow(data)
# #数据格式化输出
# def display(data):
#     print("{1:<10}{2:{0}^20}{3:{0}^16}".format(chr(12288),"序号","电影名","豆瓣评分"))
#     for i in range(len(data)):
#         print("{1:<10}{2:{0}^20}{3:{0}^30}".format(chr(12288),i+1,data[i][0],data[i][1]))
# #main函数定义及调用
# def main():
#     result=[]
#     
```python
url="https://movie.douban.com/top250"

html=getHtml(url)

result=parserHtml(html,"div",{'class':'info'})

display(result)

#主函数调用
#main()

```

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-showbo 2021-12-03 22:09
关注
被反扒了，加上User-Agent

def getHtml(url): r=requests.get(url,headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'}) r.encoding='utf-8' return r.text
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析
2023-09-26 12:04

jojo来根易安的博客本次程序只爬取了豆瓣top250电影的展示页面的数据，没有爬取电影详情页的数据。在前面我们已经获取了每一部电影详情页的链接links，如果想要爬取电影的详情页，可以通过for循环遍历列表links，对每一个详情页发起...
python爬取豆瓣Top250完整代码
2021-10-18 20:00

有大大梦想的奋斗者的博客 python爬虫 # -*- coding = utf-8 -*- # @Time : 2021/8/24 10:59 # @Author : 罗宗苇 # @File : spider.py # @Software : PyCharm from bs4 import BeautifulSoup # 网页解析，获取数据 import re # 正则表达式，...
使用python爬取豆瓣电影top250的数据
2023-11-07 14:00

提醒一下哟的博客爬取豆瓣top250比较适合初学者用于练习和熟悉爬虫技能知识的简单实战项目，通过这个项目，可以让小白对爬虫有一个初步认识和了解。那么就让我们开始吧！爬虫（Spider）是一种自动化程序，用于在互联网上抓取和提取...
python爬虫案例精讲：爬取豆瓣电影Top250信息
2024-11-29 16:46

CV-King的博客在这篇博客中，我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求，BeautifulSoup库来解析HTML页面，并将数据存储到CSV文件中。这个爬虫将自动获取豆瓣电影Top250页面的信息，...
【Python】-- 使用BeautifulSoup爬取豆瓣电影Top250榜单
2024-11-17 19:39

apwangzitong的博客这个扩展包为待解析的页面建立一棵树，以便提取其中的数据。BeautifulSoup 本身并不提供网络连接功能，它通常与像 requests 这样的HTTP库一起使用，以便从网络上获取 HTML 或 XML 内容，并随后使用 BeautifulSoup 来...
python爬取豆瓣top250信息并存入数据库中 | sqlite3
2021-09-09 22:57

~柠月如风~的博客 python爬取豆瓣top250信息并存入数据库中,使用sqlite3数据库；涉及为什么HTML字段中会出现&NBSP；java.io.IOException: 不能删除数据库文件
python爬取豆瓣电影top250_Python爬虫 - scrapy - 爬取豆瓣电影TOP250
2020-11-27 18:10

weixin_39614831的博客 0.前言新接触爬虫，经过一段时间的实践，写了几个简单爬虫，爬取豆瓣电影的爬虫例子网上有很多，但都很简单，大部分只介绍了请求页面和解析部分，对于新手而言，我希望能够有一个比较全面的实例。所以找了很多实例和...
一分钟学会python爬取豆瓣top250电影
2021-09-06 22:28

我好瞌睡呀.的博客一分钟python爬取豆瓣top250电影真想说：python的强大的库，各种库。啧啧啧。是一些语言不能比的。但是个人感觉如果是要写大型后端的话，python还是不太行的运行效果爬取网页话不多说，直接看代码（代码都有...
【python】爬虫：爬取豆瓣top250电影名单
2023-12-14 20:24

白嫩的六角龙鱼的博客 requests做http请求豆瓣top250电影名单,用BeautifulSoup分析爬回的html信息,提取电影名以及评分,最后prettytable显示.Python requests 是一个常用的 HTTP 请求库，可以方便地向网站发送 HTTP 请求，并获取响应结果。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月3日

为什么爬取豆瓣top250得到是的是个空列表啊

html=getHtml(url)

result=parserHtml(html,"div",{'class':'info'})

display(result)

2条回答 默认 最新

问题事件

2条回答默认最新