Acceptes 2021-10-31 23:19 采纳率: 25%
浏览 49
已结题

python爬虫爬到的网页内容不完全


import requests
from lxml import etree
from bs4 import BeautifulSoup
header = {
        'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
    }


resp=requests.get("http://ziziyy1.com/tv/",headers=header)
resp.encoding='utf-8'
print(resp.text)


resp.text与网页源代码不同

  • 写回答

1条回答 默认 最新

  • 努力中的小白️ 2021-10-31 23:40
    关注

    beautifulsoup是爬静态网页的,应该是有些内容属于动态,可以尝试selenium

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月9日
  • 已采纳回答 11月1日
  • 创建了问题 10月31日