云yun云\^O^/ 2021-08-08 11:16 采纳率: 50%
浏览 173
已结题

python爬取并下载的文件为什么是空白且加载不出来?

我在试着跟视频学习python爬取并下载贴吧的实战的时候,我发现自己下载好了之后,点开以后显示是这个样子的,一直在加载,在加载好还是出不来,希望各位看一下

from urllib import request
import urllib
import time

#构造请求头信息
header={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.62",
        "cokie":"BAIDUID_BFESS=C21E87F3A6141FEB572318C6401DB7F7:FG=1; __yjs_duid=1_f40a3356560e7cb76db7f507636f39241627698973259; BIDUPSID=D0964D17E35A3545AC619ADA558551F9; PSTM=1627874092; BAIDUID=D0964D17E35A35450EB2B011CB5E575B:FG=1; ab_sr=1.0.1_ZTNiYTdjNjVmNjA2NTZlYWNkODZhZjBmNmMxMzJlZWUxZGJiMGFhZTBmN2M3N2EzNjAyMTdlMGM4MDIxNjA2ZGQ4NDRkNzNhMmZmMmM2NTFlMDFiYTBhMGEyYWYzNTYwZjY3ZDg5NzE0MDQwMDVmZjNlM2M1NDQ1ZWIzMTVmZWJhYjU5Y2MwMDA2M2M5YmFhNmExMWRhY2FhYTVlODhlNw==",
        }

#https://tieba.baidu.com/f?kw=python&ie=utf-8    第一页
#https://tieba.baidu.com/f?kw=python&ie=utf-8&pn=0  第一页
#https://tieba.baidu.com/f?kw=python&ie=utf-8&pn=50   第二页
#https://tieba.baidu.com/f?kw=python&ie=utf-8&pn=100    第三页

def loadpage(fullurl,filname):
    print("正在下载:",filname)
    req=request.Request(fullurl,headers=header)
    response=request.urlopen(req).read()
    return response

def writepage(html,filname):
    print("正在保存:",filname)

    with open(filname,"wb") as f:
        f.write(html)

    print("-------------------")


#构造url
def tiezi(url,begin,end):
    for page in range(begin,end+1):
        pn=(page-1)*50
        fullurl=url+"&pn="+str(pn)  #贴吧每一页的网址
        filname="D:/第"+str(page)+"页.html"  #每次请求保存文件名

        html=loadpage(fullurl,filname)  #调用爬虫,爬取网页
        writepage(html,filname)   #把获取的网页信息写入本地


if __name__ == '__main__':
    
    kw=input("请输入贴吧名:")
    begin=int(input("请输入起始页:"))
    end=int(input("请输入结束页:"))
    url="http://tieba.baidu.com/f?"
    #构造url编码
    key=urllib.parse.urlencode({"kw":kw})

    url=url+key
    tiezi(url,begin,end)
    time.sleep(10)


img

img

img

img

  • 写回答

2条回答 默认 最新

  • 尘世镜花恋 2021-08-08 12:28
    关注

    你只是爬取了html网页,,怎么能让你运行人家的网页呢
    你说的加载不出来那是肯定的
    这个样子应该你只是爬了个外壳,css和js都不能用了,所以背景是白的,按钮都是没有样式的
    如果明白了,点击右上角给个采纳哦~随时可以问我问题

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月16日
  • 已采纳回答 8月8日
  • 创建了问题 8月8日

悬赏问题

  • ¥15 在虚拟机中安装flash code
  • ¥15 单片机stm32f10x编写光敏电阻调节3.3伏大功率灯亮度(光强越大灯越暗,白天正常光强灯不亮,使用ADC,PWM等模块)望各位找一下错误或者提供一个可实现功能的代码
  • ¥20 verilog状态机方法流水灯
  • ¥15 pandas代码实现不了意图
  • ¥15 GD32H7 从存储器到外设SPI传输数据无法重复启用DMA
  • ¥25 LT码在高斯信道下的误码率仿真
  • ¥45 渲染完成之后将物体的材质贴图改变,自动化进行这个操作
  • ¥15 yolov5目标检测并显示目标出现的时间或视频帧
  • ¥15 电视版的优酷可以设置电影连续播放吗?
  • ¥50 复现论文;matlab代码编写