weixin_42393264 2010-08-09 16:52
浏览 684
已采纳

一个很有档次的问题,呵呵(Not in GZIP format)

我在用socket下载页面(http://www.amazon.cn/mn/detailApp?ref=RK&uid=478-9408365-8400056&asin=B0036DD2ZS )时,在解压gzip时出现这个问题:

Exception in thread "main" java.io.IOException: Not in GZIP format
at java.util.zip.GZIPInputStream.readHeader(GZIPInputStream.java:137)
at java.util.zip.GZIPInputStream.(GZIPInputStream.java:58)
at java.util.zip.GZIPInputStream.(GZIPInputStream.java:68)

我想可能是http header部分和html部分切分的不够好,但是我试了很多切分, 都是这个问题, 现在不知道是什么原因导致这个异常,还有就是 , 我在读socket输入流时 ,总是在一个地方停下来,过来很长(好几分钟)时间才会读完,每次出现这个现象, 那么这个gzip的解压就一定出问题,如果很快的读完socket输入流,那就解压正常,我想求教各位这是为什么??谢谢 了!!!

  • 写回答

3条回答 默认 最新

  • 一向天 2010-08-13 13:55
    关注

    这个问题我也刚解决,我估计你是没有注意其中的http响应中会有一个transfer-encoding:chunked。 这个是一个分段传输的标志,所以你在解析数据时需要按照chunked的规范提取对应的数据,过滤掉如数据长度之类的信息,然后再对数据进行gzip解压,这样就可以了。 不一定是你说的切分的问题。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥20 测距传感器数据手册i2c
  • ¥15 RPA正常跑,cmd输入cookies跑不出来
  • ¥15 求帮我调试一下freefem代码
  • ¥15 matlab代码解决,怎么运行
  • ¥15 R语言Rstudio突然无法启动
  • ¥15 关于#matlab#的问题:提取2个图像的变量作为另外一个图像像元的移动量,计算新的位置创建新的图像并提取第二个图像的变量到新的图像
  • ¥15 改算法,照着压缩包里边,参考其他代码封装的格式 写到main函数里
  • ¥15 用windows做服务的同志有吗
  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法