(๑✦ˑ̫✦)✨ 2019-06-06 11:10 采纳率: 0%
浏览 2646

python 用request.get()方法得到的代码与浏览器中的代码不一样,关键要的数据都没有,望大神指点

import requests
import re
from bs4 import BeautifulSoup
import time
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36'}
res=requests.get('https://y.qq.com/n/yqq/toplist/26.html#t1=2019&t2=20&t3=song&t4=1&t5=1',headers=header)
soup=BeautifulSoup(res.text,'lxml')
print(soup)

这是QQ音乐的官方网站,想从中得到歌曲的信息,用这个方法得到的代码比浏览器中代码缺少很多,没去歌曲的信息,只有一些界面的代码

  • 写回答

3条回答 默认 最新

  • Mr.Yun 2019-06-06 11:15
    关注

    废话,你的header信息就一个,直接就被反爬取了,补全它.
    而且你这样爬取也有问题,直接怕一个网页,网页调用的其他api也没有爬取,肯定数据会缺失

    评论

报告相同问题?

悬赏问题

  • ¥15 HLs设计手写数字识别程序编译通不过
  • ¥15 Stata外部命令安装问题求帮助!
  • ¥15 从键盘随机输入A-H中的一串字符串,用七段数码管方法进行绘制。提交代码及运行截图。
  • ¥15 TYPCE母转母,插入认方向
  • ¥15 如何用python向钉钉机器人发送可以放大的图片?
  • ¥15 matlab(相关搜索:紧聚焦)
  • ¥15 基于51单片机的厨房煤气泄露检测报警系统设计
  • ¥15 Arduino无法同时连接多个hx711模块,如何解决?
  • ¥50 需求一个up主付费课程
  • ¥20 模型在y分布之外的数据上预测能力不好如何解决