hange1991 2023-02-09 09:28 采纳率: 90.9%
浏览 36
已结题

python抓包后不能获取和打开

提问仅用于科研学习,不涉及任何商业用途

通过网页打开准备获取的信息

img

找到该内容的URL,并确定URL对应的就是上述内容:

img

对应python代码如下:
import requests
import json

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 '
                  'Safari/538.36 Edg/109.0.1516.67 '
}

url = 'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid' \
      '=MS4wLjABAAAAF6DBprxchsasOrovWpV5cSeLw1aKKfX1ONlSV5sDExI&count=21&max_cursor=0&msToken' \
      '=VTpFKsbuCK5bmTK3ohT4iZRnbjJ7LtPQm9hQaVKCnHBVHr098t5hkXt3ggC86y49EqZ3S4uj4MXRsfIsSqsCJK6EhEC' \
      'v8s8aRNQoCtJCQ4prS3DyFczfpoE3b1h9SMBALgc=&X-Bogus=DFSzKwVO5UUANGU6ShWhRKXAIQ53&_signature=_02B4Z6wo00001h' \
      'uhShgAAIDDeKuKcq8UKXYbsU6AAOUZ7AI4sVgClohIqXJ2MfChE3TUAF1GJ.9FZKNW4OblnAHBtqmfIIMRB-wD6oW5U05NCkE3QrFFc.' \
      'JBDlJOIFgmhsQl5cMarV7Hg0xza1 '
res = requests.get(url=url, headers=headers)

print('content', res.content)
print('text', res.text)

运行结果:
content b''
text 


拟获取的信息理应是图一中右侧的信息,想请教一下是代码的问题吗,如何正确获取图一右侧内容?图一右侧的代码是json格式吗?

  • 写回答

2条回答 默认 最新

  • 一花一草皆风景 2023-02-09 09:49
    关注

    1.代码本身没有问题,可以换一个其他的URL,例如某度的网址应该就能返回数据,你这个图片看不到请求,理论上请求头部应该加上cookie;
    2.获取数据理论上是可以的,有时候接口可能返回空数据,因此需要多试几次,一般过了人工滑动验证后的接口基本可用;
    3.右侧看着是json格式,想确认是否是json格式,可以查看标头的响应内容的内容类似Content-Type,其会显示内容格式。
    如未能解决,可以继续与我联系。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月13日
  • 已采纳回答 2月9日
  • 创建了问题 2月9日

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助