喵太狼 2018-04-09 15:43 采纳率: 50%
浏览 1736
已采纳

解析这个HTTP包里的content内容参数

这个是我用【Charles4.2.1】抓到的百词斩APP的查词请求:
https://pan.baidu.com/s/18hIuHHmcjYrF6_7_mVjQqw

我最终的目的是用代码模拟POST和GET请求,获得所要查的单词的资源。
我发现POST包中content包含的查词指令可以直接看到,但是包含有乱码,并且GET包中获得的content也有乱码。
请问该如何解决乱码问题,并实现用代码直接向网络查词??

(另外我猜测链接最后的13位数字是时间信息--“15222...”开头的)

  • 写回答

5条回答 默认 最新

  • 三阶魔方 2018-04-09 16:48
    关注

    猜测百词斩内部极有可能使用byte接受content内容的,里面包含控制字段,随便拿了你抓包的内容。
    第一个包的内容单独用utf8去看。

     n. 字母 用以构成家名、店名等;用以构成单数名词或不以s结尾的复数名词的所有格]表示
    

    大致能看到内容,其中其他的东西,应该是控制,比如EF BF用来控制结束什么的。

    所以你get和post的时候,需要用bytes去存储content,然后再根据一定的协议增加占位符,

    比如他的请求,前四位应该是顺序号
    00 00 00 17 然后顺序累加,82 21 01 0E 是报文头,然后后面是search_w 表示请求。然后是ord_v2,之后是18分隔符,下一位是单词长度,后面n位是单词,最后00结尾。

    然后152那个确实是时间,是时间戳,从 1970/01/01 至今已过去 1523291937000 毫秒,这是当前的时间戳。一般unit的要准一点,应该是纯粹为了防止重复请求缓存的

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥35 平滑拟合曲线该如何生成
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了
  • ¥15 链式存储应该如何解决
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站