Acceptes 2021-10-31 23:19 采纳率: 25%
浏览 45
已结题

python爬虫爬到的网页内容不完全


import requests
from lxml import etree
from bs4 import BeautifulSoup
header = {
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
    }


resp=requests.get("http://ziziyy1.com/tv/",headers=header)
resp.encoding='utf-8'
print(resp.text)


resp.text与网页源代码不同

  • 写回答

1条回答 默认 最新

  • 努力中的小白️ 2021-10-31 23:40
    关注

    beautifulsoup是爬静态网页的,应该是有些内容属于动态,可以尝试selenium

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月9日
  • 已采纳回答 11月1日
  • 创建了问题 10月31日

悬赏问题

  • ¥15 如何让企业微信机器人实现消息汇总整合
  • ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
  • ¥15 如何用Python爬取各高校教师公开的教育和工作经历
  • ¥15 TLE9879QXA40 电机驱动
  • ¥15 clion的参数提示怎么关闭
  • ¥20 对于工程问题的非线性数学模型进行线性化
  • ¥15 Mirare PLUS 进行密钥认证?(详解)
  • ¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
  • ¥20 想用ollama做一个自己的AI数据库
  • ¥15 关于qualoth编辑及缝合服装领子的问题解决方案探寻