喵太狼 2018-04-09 15:43 采纳率: 50%
浏览 1737
已采纳

解析这个HTTP包里的content内容参数

这个是我用【Charles4.2.1】抓到的百词斩APP的查词请求:
https://pan.baidu.com/s/18hIuHHmcjYrF6_7_mVjQqw

我最终的目的是用代码模拟POST和GET请求,获得所要查的单词的资源。
我发现POST包中content包含的查词指令可以直接看到,但是包含有乱码,并且GET包中获得的content也有乱码。
请问该如何解决乱码问题,并实现用代码直接向网络查词??

(另外我猜测链接最后的13位数字是时间信息--“15222...”开头的)

  • 写回答

5条回答 默认 最新

  • 三阶魔方 2018-04-09 16:48
    关注

    猜测百词斩内部极有可能使用byte接受content内容的,里面包含控制字段,随便拿了你抓包的内容。
    第一个包的内容单独用utf8去看。

     n. 字母 用以构成家名、店名等;用以构成单数名词或不以s结尾的复数名词的所有格]表示
    

    大致能看到内容,其中其他的东西,应该是控制,比如EF BF用来控制结束什么的。

    所以你get和post的时候,需要用bytes去存储content,然后再根据一定的协议增加占位符,

    比如他的请求,前四位应该是顺序号
    00 00 00 17 然后顺序累加,82 21 01 0E 是报文头,然后后面是search_w 表示请求。然后是ord_v2,之后是18分隔符,下一位是单词长度,后面n位是单词,最后00结尾。

    然后152那个确实是时间,是时间戳,从 1970/01/01 至今已过去 1523291937000 毫秒,这是当前的时间戳。一般unit的要准一点,应该是纯粹为了防止重复请求缓存的

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

悬赏问题

  • ¥500 把面具戴到人脸上,请大家贡献智慧
  • ¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面,不要作在线的,要离线状态。
  • ¥15 各位 帮我看看如何写代码,打出来的图形要和如下图呈现的一样,急
  • ¥30 c#打开word开启修订并实时显示批注
  • ¥15 如何解决ldsc的这条报错/index error
  • ¥15 VS2022+WDK驱动开发环境
  • ¥30 关于#java#的问题,请各位专家解答!
  • ¥30 vue+element根据数据循环生成多个table,如何实现最后一列 平均分合并
  • ¥20 pcf8563时钟芯片不启振
  • ¥20 pip2.40更新pip2.43时报错