喵太狼 2018-04-09 15:43 采纳率: 50%
浏览 1736
已采纳

解析这个HTTP包里的content内容参数

这个是我用【Charles4.2.1】抓到的百词斩APP的查词请求:
https://pan.baidu.com/s/18hIuHHmcjYrF6_7_mVjQqw

我最终的目的是用代码模拟POST和GET请求,获得所要查的单词的资源。
我发现POST包中content包含的查词指令可以直接看到,但是包含有乱码,并且GET包中获得的content也有乱码。
请问该如何解决乱码问题,并实现用代码直接向网络查词??

(另外我猜测链接最后的13位数字是时间信息--“15222...”开头的)

  • 写回答

5条回答 默认 最新

  • 三阶魔方 2018-04-09 16:48
    关注

    猜测百词斩内部极有可能使用byte接受content内容的,里面包含控制字段,随便拿了你抓包的内容。
    第一个包的内容单独用utf8去看。

     n. 字母 用以构成家名、店名等;用以构成单数名词或不以s结尾的复数名词的所有格]表示
    

    大致能看到内容,其中其他的东西,应该是控制,比如EF BF用来控制结束什么的。

    所以你get和post的时候,需要用bytes去存储content,然后再根据一定的协议增加占位符,

    比如他的请求,前四位应该是顺序号
    00 00 00 17 然后顺序累加,82 21 01 0E 是报文头,然后后面是search_w 表示请求。然后是ord_v2,之后是18分隔符,下一位是单词长度,后面n位是单词,最后00结尾。

    然后152那个确实是时间,是时间戳,从 1970/01/01 至今已过去 1523291937000 毫秒,这是当前的时间戳。一般unit的要准一点,应该是纯粹为了防止重复请求缓存的

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥15 identifier of an instance of 类 was altered from xx to xx错误
  • ¥100 反编译微信小游戏求指导
  • ¥15 docker模式webrtc-streamer 无法播放公网rtsp
  • ¥15 学不会递归,理解不了汉诺塔参数变化
  • ¥30 软件自定义无线电该怎样使用
  • ¥15 R语言mediation包做中介分析,直接效应和间接效应都很小,为什么?
  • ¥15 Jenkins+k8s部署slave节点offline
  • ¥15 如何实现从tello无人机上获取实时传输的视频流,然后将获取的视频通过yolov5进行检测
  • ¥15 WPF使用Canvas绘制矢量图问题
  • ¥15 用三极管设计一个单管共射放大电路