春风十里往事如烟 2021-08-08 18:56 采纳率: 100%
浏览 40
已结题

爬虫出来的代码为啥没头?

这是网页上看的代码
img
这是我爬出来的,为啥它连html的头html head 什么的都没有,感觉就像从一半开始获取的
img
这是我照着敲的代码
img
img
请各路厉害的人一下讲解为什么,我刚照着书上敲的(最好有修改的建议

  • 写回答

2条回答 默认 最新

  • 关注

    因为命令行输出缓存有限。当输出内容太多时会自动删除前面的一部分内容。
    你可以把获取的内容写入到一个文件中,就能看到完整的内容。

    html = response.read().decode("utf-8")
    with open(r'xxxx.html', 'w', encoding='utf-8') as fileObj:
        fileObj.write(html)
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月16日
  • 已采纳回答 8月8日
  • 创建了问题 8月8日

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器