hange1991 2023-02-09 09:28 采纳率: 90.9%
浏览 36
已结题

python抓包后不能获取和打开

提问仅用于科研学习,不涉及任何商业用途

通过网页打开准备获取的信息

img

找到该内容的URL,并确定URL对应的就是上述内容:

img

对应python代码如下:
import requests
import json

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 '
                  'Safari/538.36 Edg/109.0.1516.67 '
}

url = 'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid' \
      '=MS4wLjABAAAAF6DBprxchsasOrovWpV5cSeLw1aKKfX1ONlSV5sDExI&count=21&max_cursor=0&msToken' \
      '=VTpFKsbuCK5bmTK3ohT4iZRnbjJ7LtPQm9hQaVKCnHBVHr098t5hkXt3ggC86y49EqZ3S4uj4MXRsfIsSqsCJK6EhEC' \
      'v8s8aRNQoCtJCQ4prS3DyFczfpoE3b1h9SMBALgc=&X-Bogus=DFSzKwVO5UUANGU6ShWhRKXAIQ53&_signature=_02B4Z6wo00001h' \
      'uhShgAAIDDeKuKcq8UKXYbsU6AAOUZ7AI4sVgClohIqXJ2MfChE3TUAF1GJ.9FZKNW4OblnAHBtqmfIIMRB-wD6oW5U05NCkE3QrFFc.' \
      'JBDlJOIFgmhsQl5cMarV7Hg0xza1 '
res = requests.get(url=url, headers=headers)

print('content', res.content)
print('text', res.text)

运行结果:
content b''
text 


拟获取的信息理应是图一中右侧的信息,想请教一下是代码的问题吗,如何正确获取图一右侧内容?图一右侧的代码是json格式吗?

  • 写回答

2条回答 默认 最新

  • 一花一草皆风景 2023-02-09 09:49
    关注

    1.代码本身没有问题,可以换一个其他的URL,例如某度的网址应该就能返回数据,你这个图片看不到请求,理论上请求头部应该加上cookie;
    2.获取数据理论上是可以的,有时候接口可能返回空数据,因此需要多试几次,一般过了人工滑动验证后的接口基本可用;
    3.右侧看着是json格式,想确认是否是json格式,可以查看标头的响应内容的内容类似Content-Type,其会显示内容格式。
    如未能解决,可以继续与我联系。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 2月13日
  • 已采纳回答 2月9日
  • 创建了问题 2月9日

悬赏问题

  • ¥100 set_link_state
  • ¥15 虚幻5 UE美术毛发渲染
  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度