pycharm爬取的内容显示空白

from urllib.request import Request, urlopen
from urllib.parse import urlencode
from fake_useragent import UserAgent

def get_html(url):
    headers = {
        "User-Agent":UserAgent().chrome
    }
    request = Request(url,headers=headers)
    response = urlopen(request)
    print(response.read().decode())
    return  response.read()

def save_html(fliename , html_bytes):

    with open(fliename, "wb")as f:
        f.write(html_bytes)


def main():
    content = input('请输入要下载的内容：')
    num = input('请输入要下载多少页：')
    base_url = "https://tieba.baidu.com/f?ie=utf-8&{}"
    for pn in range(int(num)):
        args = {
            'pn':pn*50,
            'kw':content
        }
        fliename = '第' + str(pn + 1) + "页.html"
        args = urlencode(args)
        print('正在下载'+fliename)
        html_bytes = get_html(base_url.format(args))
        save_html(fliename,html_bytes)

if __name__ == '__main__':
    main()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
坚持不懈的大白优质创作者: 前端开发技术领域 2021-04-14 08:19
关注
查看网页源代码可以发现这是动态加载的，通过这样根本爬取不到信息，可以考虑使用selenium模块试试

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

2025最新版PyCharm安装教程，Python环境配置和使用指南（超详细）
2025-02-14 17:23

bug鸭陆的博客 Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具三、Python学习视频合集...
python爬取图片_python批量爬取unsplash图片
2020-12-07 11:32

weixin_39884492的博客本文实现了利用python批量爬取unsplash图片，主要用到了requests、json、os、time库，IDE使用pycharm，效率大概是每分钟爬取4-10张高清图（一张10M左右，下载速度取决于图片大小还有网速）。首先，打开要爬取的网页...
手把手教你python--爬取网站首页（学生必看）
2022-05-06 15:55

志强不息　的博客 0基础小白也能学会的用 python 爬取网站首页，方法超级简单，今天手把手教你。
Python Scrapy：爬取动态加载的内容
2025-04-08 17:12

AI Python 编程的博客深入分析动态内容加载的技术原理系统介绍Scrapy框架处理动态内容的各种方法提供实际可行的解决方案和最佳实践探讨相关的高级话题和优化技巧本文涵盖从基础到进阶的内容，适合不同层次的开发者参考。背景介绍：建立...
python爬虫：爬取豆瓣阅读出版社数据
2020-03-14 09:08

数据分析阿宇君的博客爬虫类型很多，常用的有通用网络爬虫（爬取网站所有内容）和聚焦网络爬虫（针对某一特定需求） 3爬虫原理 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ayGTorSC-1584147798547)...
python爬取微博热搜并直接写入mysql
2019-06-13 19:04

雨.山的博客通过**正则表达式**爬取新浪微博热搜并直接写入本地mysql数据库。准备工作软件准备：（1）navicat （2）pycharm （3）anaconda 通过navicat建库建表：打开navicat, 左键单击左上角“连接”，弹出窗口 ...
Python Scrapy：爬取新闻资讯数据的方法
2025-05-15 17:58

AI Python 编程的博客本文旨在为开发人员提供一套完整的新闻资讯数据...Scrapy：一个用Python编写的开源网络爬虫框架Spider：Scrapy中定义如何爬取特定网站的类Item：爬取数据的容器，类似Python字典Selector：用于从网页中提取数据的工具。
Python爬虫：简易图片爬取
2023-10-06 22:07

訫契的博客对该页面往下翻，并复制...再复制负载内容，粘贴进代码里（注：这里要删除没有内容的名称）page_num = input("请输入你要抓取的页数:")page_num = input("请输入你要抓取的页数:")fold_name = input("请输入图片名:")
python爬取网站万张美女、风景..等图片
2023-12-27 22:08

yuwenduo123的博客 python爬取爬虫爬取美女、风景等万张图片
python爬取文库,python爬取文库ppt的简单实现
2021-04-27 08:51

weixin_39731782的博客背景：最近在看各种金融相关的文档，觉得还是课件ppt上讲的逻辑清晰，好理解一些，但是各个网站下载很贵，总是在线看又怕... 五、所有代码 # @Time : 2020/9/1 # @Author : 大太阳小白 # @Software: PyCharm # @blog：...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月28日

pycharm爬取的内容显示空白

2条回答 默认 最新

问题事件

2条回答默认最新