为什么我爬到的东西是空白的网页

from urllib import request
import urllib
import time

def loadpage(fullurl,filename):
print("正在下载:",filename)
header={
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.
0.3538.25 Safari/537.36 Core/1.70.3641.400 QQBrowser/10.4.3284.400"
}
req=request.Request(fullurl,headers=header)
response=request.urlopen(req).read()
return response

def writepage(html,filename):
print("正在保存:",filename)
with open(filename,"wb") as f:
f.write(html)#wb表示以二进制的形式写入文件
print("------------------")

def tiebaSpider(url,begin,end):#构造url
for page in range(begin,end+1):
pn=(page-1)*50
#每次请求完成的url
fullurl=url+"&pn="+str(pn)#因为pn是数字，所以用str转换成字符串
filename="e:/nsxt/第"+str(page)+"页.html"#每次请求后保存的文件名

    html=loadpage(fullurl,filename)#爬取网页

    writepage(html,filename)#把获取的信息写到本地

if name == 'main':#开始执行
kw=input("请输入要爬取的贴吧名:")
begin=int(input("请输入起始页:"))
end=int(input("请输入结束页:"))

url="http://tieba.baidu.com/f?"

key=urllib.parse.urlencode({"kw":kw})

a=url+key
tiebaSpider(url,begin,end)

time.sleep(8)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
m0_59725299 2021-07-30 15:41
关注
这个我也不知道

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫返回的html文件打开网页是空的 python
2022-06-15 23:07

回答 1 已采纳很正常，一个网页能运行，不但需要html文件，还需要css和js文件在背后支撑。（前端和后端）你只是爬下来了一个html文件，自然什么都不会展示出来。你仔细想想，如果这么轻易的就能被你爬到百度的htm
python读取excel显示空白是为什么， python
2022-03-05 11:56

回答 1 已采纳路径不要加中文呢
python爬取并下载的文件为什么是空白且加载不出来？ python
2021-08-08 11:16

回答 2 已采纳你只是爬取了html网页，，怎么能让你运行人家的网页呢你说的加载不出来那是肯定的这个样子应该你只是爬了个外壳，css和js都不能用了，所以背景是白的，按钮都是没有样式的如果明白了，点击右上角给个采纳哦
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-12-22 19:08

奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者...
python爬取到的网页文本，保存本地txt显示文件为空？什么原因呢？ python 有问必答
2022-04-07 11:17

回答 3 已采纳 w改为a（追加），要不会将当前写入的内容覆盖文件内容要么将open和close放到for循环外
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
为什么爬取的网站，页面代码少了好多，然后网站显示空白 python 有问必答爬虫
2022-02-19 20:26

回答 3 已采纳你是用requests爬取网页的吗你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用s
Python爬虫入门教程：超级简单的Python爬虫教程.pdf
2024-03-20 21:31

在进行Python爬虫开发之前，首先要了解网页的基本构成。网页通常包含三个主要部分：HTML（超文本标记语言）、CSS（层叠样式表）以及JavaScript（一种常用的脚本语言）。 1. **HTML**： - **定义**：HTML是构建网页...
用PYTHON 的 requests库请求一个post 状态码是200，但是返回内容是空 javascript python 爬虫
2022-07-16 17:00

回答 5 已采纳 body中的data参数是用urlencoded形式传过去的，用urlencode处理一下 import requests from urllib.parse import urlencode i
python在post请求下爬取数据，返回的值为什么为空？ python
2019-05-29 17:34

回答 6 已采纳是因为你给的数据不足够，我刚才打开你的网站试了一下。 # header中必须有以下数据 ![图片说明](https://img-ask.csdn.net/upload/201905/30/1559
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
python爬虫案例.docx
2024-07-17 21:01

本案例旨在介绍一个基础的Python爬虫程序，通过该程序我们可以了解如何从指定网页抓取数据。案例涵盖了发送HTTP请求、解析HTML内容、提取所需数据的基本步骤，并提供了相关的注意事项。 #### 技术栈 - **Requests*...
fiddler里爬下来的response body为空 python 爬虫
2022-07-27 23:55

回答 2 已采纳你用手机浏览器打开一个https的链接，能抓到就是app加密了。抓不到就是你没配置好。
Python爬虫requests返回值为空的解决方案
2023-05-24 07:45

爱编程的喵喵的博客本文主要介绍了requests返回值为空的解决方案，希望能对学习爬虫的同学们有所帮助。需要说明的是，该方案适合无需进行登录账户等其他操作就能通过浏览器看到网站内容的情况，而不适用更加复杂的场景。文章目录 1....
Python-数据爬取（爬虫）
2024-07-12 17:01

.房东的猫的博客定义：深度优先搜索是一种遍历或搜索树或图的算法，从起始节点开始，一直沿着一个分支走到底，再回溯到上一个节点继续搜索下一个分支，直到遍历完所有节点。特点递归：通常用递归实现，或者使用栈来模拟递归过程。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月29日

悬赏问题

¥20 帮我解决这个项目，thank you各位程序员
¥15 哪位能用ea软件做一下，有偿
¥15 按要求编写汇编语言，并设计仿真电路图
¥15 电脑软件运行次数如何统计
¥15 同一个浏览器打开两个窗口怎么区分会话
¥100 如何编写自己的emmc镜像
¥15 starccm线性内聚力模型
¥15 点云四边形凸包确定顶点
¥15 关于redhat虚拟机系统新建卷的问题
¥50 WRFDA读取风云四号A 星的GIIRS数据

为什么我爬到的东西是空白的网页

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新