(๑✦ˑ̫✦)✨ 2019-06-06 11:10 采纳率: 0%
浏览 2645

python 用request.get()方法得到的代码与浏览器中的代码不一样,关键要的数据都没有,望大神指点

import requests
import re
from bs4 import BeautifulSoup
import time
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36'}
res=requests.get('https://y.qq.com/n/yqq/toplist/26.html#t1=2019&t2=20&t3=song&t4=1&t5=1',headers=header)
soup=BeautifulSoup(res.text,'lxml')
print(soup)

这是QQ音乐的官方网站,想从中得到歌曲的信息,用这个方法得到的代码比浏览器中代码缺少很多,没去歌曲的信息,只有一些界面的代码

  • 写回答

3条回答

  • Mr.Yun 2019-06-06 11:15
    关注

    废话,你的header信息就一个,直接就被反爬取了,补全它.
    而且你这样爬取也有问题,直接怕一个网页,网页调用的其他api也没有爬取,肯定数据会缺失

    评论

报告相同问题?

悬赏问题

  • ¥15 python的qt5界面
  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致
  • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
  • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
  • ¥15 谁有desed数据集呀
  • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100