这个是我用【Charles4.2.1】抓到的百词斩APP的查词请求:
https://pan.baidu.com/s/18hIuHHmcjYrF6_7_mVjQqw
我最终的目的是用代码模拟POST和GET请求,获得所要查的单词的资源。
我发现POST包中content包含的查词指令可以直接看到,但是包含有乱码,并且GET包中获得的content也有乱码。
请问该如何解决乱码问题,并实现用代码直接向网络查词??
(另外我猜测链接最后的13位数字是时间信息--“15222...”开头的)
这个是我用【Charles4.2.1】抓到的百词斩APP的查词请求:
https://pan.baidu.com/s/18hIuHHmcjYrF6_7_mVjQqw
我最终的目的是用代码模拟POST和GET请求,获得所要查的单词的资源。
我发现POST包中content包含的查词指令可以直接看到,但是包含有乱码,并且GET包中获得的content也有乱码。
请问该如何解决乱码问题,并实现用代码直接向网络查词??
(另外我猜测链接最后的13位数字是时间信息--“15222...”开头的)
猜测百词斩内部极有可能使用byte接受content内容的,里面包含控制字段,随便拿了你抓包的内容。
第一个包的内容单独用utf8去看。
n. 字母 用以构成家名、店名等;用以构成单数名词或不以s结尾的复数名词的所有格]表示
大致能看到内容,其中其他的东西,应该是控制,比如EF BF用来控制结束什么的。
所以你get和post的时候,需要用bytes去存储content,然后再根据一定的协议增加占位符,
比如他的请求,前四位应该是顺序号
00 00 00 17 然后顺序累加,82 21 01 0E 是报文头,然后后面是search_w 表示请求。然后是ord_v2,之后是18分隔符,下一位是单词长度,后面n位是单词,最后00结尾。
然后152那个确实是时间,是时间戳,从 1970/01/01 至今已过去 1523291937000 毫秒,这是当前的时间戳。一般unit的要准一点,应该是纯粹为了防止重复请求缓存的