python爬虫，爬取的url内容没有反馈

根据B站学习视频学习爬虫，代码一样但是老师有反馈内容，但是自己的没有，是空白，代码如下，有大佬能帮忙解答下吗？

from bs4 import BeautifulSoup #网页解析，获取数据
import re #正则表达式，进行文字匹配
import urllib.request,urllib.error #制定URL，获取网页数据
import xlwt #进行exel操作
import sqlite3 #进行SQLITE数据库操作

def main():
baseurl = "https://movie.douban.com/top250?start="
#1爬取网页
datalist = getData(baselist)
savepath = ".\豆瓣电影top250.xsl"
#保存数据
#saveData(savepath)
askURL("https://movie.douban.com/top250?start=0")

#爬取网页

def getData(baseurl):
datalist = []
for i in range(0,10): #调用获取页面信息的函数，10次
url = baseurl + str(i*25)
html = askURL(url) #保存获取到的网页源码

#2逐一解析数据
return datalist

#得到指定一个URL的网页内容
def askURL(url):
head = { #模拟浏览器头部信息，向豆瓣服务器发送消息
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"
}
#用户代理，表示告诉豆瓣服务器，我们是什么类型的机器、浏览器（本质告诉浏览器，我们可以接收什么内容）

request = urllib.request.Request(url,headers = head)
html = ""
try:
    response = urllib.request.urlopen(request)
    html = response.read().decode("utf-8")
    print(html)
except urllib.error.URLError as e:
    if hasattr(e,"code"):
        print(e,code)
    if hasattr(e,"reason"):
        print(e,reason)

return html

#3保存数据
def saveData(savepath):
return savepath

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 17:39
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
这篇文章：Python爬虫如何获取页面内所有URL链接？本文详解也许有你想要的答案，你可以看看

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取到的内容无法输出到txt文档中 python
2022-08-12 12:20

回答 3 已采纳不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
关于#python#的问题：python爬虫爬取百度图片 python 有问必答爬虫
2021-11-27 22:00

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬虫爬取网页图片
2022-12-22 18:05

chenruhan_QAQ_的博客 python爬虫爬取网页上的图片
python爬虫爬取图片下载本地 python 爬虫
2021-10-29 22:05

回答 2 已采纳文件路径不能有斜杠
python爬虫爬取百度文库 python 有问必答
2021-05-09 14:36

回答 4 已采纳 Network中找不到试试在doc里面能不能找到
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
python爬虫爬取电影数据并做可视化
2023-09-18 13:26

BUG再也不见的博客对爬取的数据进行可视化
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python爬虫问题求解 python 爬虫
2022-04-29 11:12

回答 1 已采纳我给你改了一下，你对比看看吧： from bs4 import BeautifulSoup import pandas as pd import requests def crawer_travel
python爬虫爬取网页表格数据
2020-12-25 04:20

用python爬取网页表格数据，供大家参考，具体内容如下 from bs4 import BeautifulSoup import requests import csv import bs4 #检查url地址 def check_link(url): try: r = requests.get(url) r.raise_for_...
python爬虫爬取网页的时候get与post区别 python
2022-02-01 00:24

回答 1 已采纳 https://www.zhihu.com/tardis/sogou/art/439355463看链接，requests模块中get的参数可以放到url链接里，也可以封装到一个字典里requests.
python 爬虫爬取天气
2022-08-16 13:36

Katherine1029的博客 python 爬虫
Python爬虫爬取滚动新闻
2022-09-24 21:34

敷衍zgf的博客 python爬取新闻数据
没有解决我的问题, 去提问

悬赏问题

¥50 使用MS Log Parser查询使用Bitvise SSH Server登录的IP
¥20 校园二手交易小程序搭建
¥15 请问在ubuntu用conda创建环境报错怎么能解决
¥15 STM32CubeMX/proteus按键控制指示灯颜色切换
¥20 python，计算区位熵和扩张指数
¥15 Python环境配置
¥15 大四学生的困惑，有偿提问！
¥15 解决页面无法编入索引：被“noindex”标签排除的问题？
¥15 arduino测量电阻
¥15 快手uid转快手号谁能解决需要开发

python爬虫，爬取的url内容没有反馈

1条回答 默认 最新

悬赏问题

1条回答默认最新