春风十里往事如烟 2021-08-08 18:56 采纳率: 100%
浏览 41
已结题

爬虫出来的代码为啥没头?

这是网页上看的代码
img
这是我爬出来的,为啥它连html的头html head 什么的都没有,感觉就像从一半开始获取的
img
这是我照着敲的代码
img
img
请各路厉害的人一下讲解为什么,我刚照着书上敲的(最好有修改的建议

  • 写回答

2条回答 默认 最新

  • 关注

    因为命令行输出缓存有限。当输出内容太多时会自动删除前面的一部分内容。
    你可以把获取的内容写入到一个文件中,就能看到完整的内容。

    html = response.read().decode("utf-8")
    with open(r'xxxx.html', 'w', encoding='utf-8') as fileObj:
        fileObj.write(html)
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月16日
  • 已采纳回答 8月8日
  • 创建了问题 8月8日