Acceptes 2021-10-31 23:19 采纳率: 25%
浏览 45
已结题

python爬虫爬到的网页内容不完全


import requests
from lxml import etree
from bs4 import BeautifulSoup
header = {
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
    }


resp=requests.get("http://ziziyy1.com/tv/",headers=header)
resp.encoding='utf-8'
print(resp.text)


resp.text与网页源代码不同

  • 写回答

1条回答 默认 最新

  • 努力中的小白️ 2021-10-31 23:40
    关注

    beautifulsoup是爬静态网页的,应该是有些内容属于动态,可以尝试selenium

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月9日
  • 已采纳回答 11月1日
  • 创建了问题 10月31日

悬赏问题

  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测
  • ¥88 python部署量化回测异常问题