谷雨白 2021-02-23 10:59 采纳率: 0%
浏览 44

Python爬虫——爬取不到信息

请教一下,爬取网站,这个代码应该如何修改一下?搜索了一下应该是真假网页问题,但是还是不知道怎么解决

 

import requests

from bs4 import BeautifulSoup

url=""

header={"user-agent":"Mozilla/5.0"}

data=requests.get(url=url,headers=header)

html=data.text

print(data.status_code)

soup=BeautifulSoup(html,"lxml")

lis=soup.find_all(name="slection",attrs={"id":"ptab-0"})
for li in lis:
    print(li.text)

 

  • 写回答

1条回答 默认 最新

  • coagenth 2021-02-23 11:21
    关注

    没有具体网址,无法给你具体回答。爬取不到内容有多种原因,请求头不全面,页面是js渲染,有的需要cookies,还有你的节点选择要准确,等等。

    评论

报告相同问题?

悬赏问题

  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘