Acceptes 2021-10-31 23:19 采纳率: 25%
浏览 44
已结题

python爬虫爬到的网页内容不完全


import requests
from lxml import etree
from bs4 import BeautifulSoup
header = {
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
    }


resp=requests.get("http://ziziyy1.com/tv/",headers=header)
resp.encoding='utf-8'
print(resp.text)


resp.text与网页源代码不同

  • 写回答

1条回答 默认 最新

  • 努力中的小白️ 2021-10-31 23:40
    关注

    beautifulsoup是爬静态网页的,应该是有些内容属于动态,可以尝试selenium

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月9日
  • 已采纳回答 11月1日
  • 创建了问题 10月31日

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)