jmpjmpje 2023-09-24 15:29 采纳率: 40%

浏览 31

已结题

这是什么压缩算法？如何解压？

《这是什么压缩算法？如何解压？》

鉴于一些原因，这里无法直接贴出原代码。

//--------------------//

首先，产生一个表，初始大小是 256 + 2 头尾2字节为空格，中间的 256字节对应数据 0 - 255

即，这个表初始是这样的：空格(20h), 0, 1, 2, 3 .... 254, 255, 空格(20h)，所以它的初始大小是 258字节

初始化 2个重要的 double值， A = 1, B = 0

//--------------------//

循环开始(压缩开始), 对 [原数据 - SrcData] 进行 "逐字节" 地处理。

假设, SrcData[0] 是 74h, 那么：

X = 74h 在[表]中的偏移值。(如, 由于是第0字节, [表]还是初始状态, 所以 X = 75h, 注意 [表] 在后面还会变动! 下面会描述)

Y = (74h + 1) 在[表]中的偏移值。(接上例, Y = 76h)

//--------------------//

计算那2个 double值：

double dbVal = (A - B) / 表的当前长度; (注意表是变动的, 长度也会变动, 下面会描述)
A = B + (dbVal * Y); //接上例, A = 0.45736434108527130
B = B + (dbVal * X); //接上例, B = 0.45348837209302323

将这2个double值转换到 '二进制' 的表示形式，则：

A = 0.011101010001010111010100010101110101000101011101010001

B = 0.011101000001011111010000010111110100000101111101000001

截取出 A B 的 [小数部分] 的 "头部相同部分"

A = 0.011101010 ...
B = 0.011101000 ...

这里可以看到, 相同部分的长度(设为 Z ) = 7, 即为：0111010

那么，这个 0111010 就是最终结果！即 74h 最终变成了 0111010

注：这里有个需要特别注意的情况, 就是 '相同部分' 的长度为 0, 此时, 直接就是没有结果, 不记录!

例如(只是假设), 原数据: 58 69 05, 58 = 000 69 = 没有结果 05 = 110, 那么这3字节的压缩后会是 000110

//--------------------//

A B 值步进：

A = A * (1 << Z); //如 A = 0.45736434108527130, Z = 7, 则此处结果为 58.54263565891472609
A = A - 整数部分; //也就是说, 只取 [小数部分], 那么 A 最终结果是 0.54263565891472609

而 B 值也是同样的计算：

B = B * (1 << Z);
B = B - 整数部分; //接上例, 此时 B 值为 0.046511627906973274

//--------------------//

在最后, 对 [表] 进行变动！

取 Y 值; (注: Y = (原数据 + 1) 在[表]中的偏移值)

在 "表[Y]" 处, 插入(增加) 14个 0, 注意表的长度也增加 14 //注, 14 这个值是可以通过输入参数来配置的, 比如, 可以设为 27, 那么压缩结果会不同(这个有点像压缩级别?)

//--------------------//

至此, 当前1个字节处理完毕; 将继续处理下一个字节: 即 SrcData[1], SrcData[2], ... 直至处理完;

在处理完之后, 记录 B 的 "最后值"：

假设 SrcData 只有 1个字节, 即, 74h, 处理后为 0111010

处理完后 B 值为: 0.046511627906973274, 其二进值为: 0.00001011111010000010111110100000101111101000001 (只取 [小数部分])

特别注意！此时 B值的二进制，如果后面有 0 存在，是要删除掉的！长度是不固定的！至少看起来没有方法来确定它的长度。

那么最终得到的, 压缩后的数据是: 0111010 + 00001011111010000010111110100000101111101000001, 即: 011101000001011111010000010111110100000101111101000001

然后, 还会将 "原数据的原始长度"(即解压后长度), 通知给 <解压方>

//--------------------//

经实测, "test12345", 压缩后的最终结果为: 011101000111011101111110111100001101111101110110110001010110111101001101100100001110110101011011101101101111001

然后将二进制转换到十六进制(每次取8bit为1字节): 74 77 7e f0 df 76 c5 6f 4d 90 ed 5b b6 f2 //此转换只是方便存储与转输, 与压缩算法没有实质性的关联

经实测, 一段长度为 256字节的数据, 压缩后可达到 100多字节; 一段 500多的字节的数据, 可以压缩到 400字节左右。

//--------------------//

它的代码并不复杂，我已经用 C语言自己写了一个函数, 然后对原程序进行多次反复调试, 对不同的数据进行压缩, 然后对比结果, 都是一样的。

现在是不明白它的压缩原理是什么, 或者是叫什么压缩算法, 该如何去解压;

请指教, 谢谢!

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

13条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-09-24 21:20
关注
这是区间编码的另类实现，都由算术编码而来。你先搞清楚算术编码

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(12条)

报告相同问题？

关注问题

程序员为什么要学习数据结构与算法?
2022-06-30 14:27

Java小叮当的博客数据结构Q与算法是程序员内功体现的重要标准之一,且数据结构也应用在各个方面, 业界更有程序-数据结构+算法这个等式存在。各个中间件开发者，架构师Q他们都在努力的优化中间件、项目结构以及算法提高运行效率和...
数据结构与算法——知识点总结
2022-06-02 17:36

卷不动的程序猿的博客本文包含数据结构与算法主要的基本知识点，便于知识的梳理和回顾。如需详细了解具体知识点请自行结合课本或者网上查阅。目录 1、概述 2、线性表 3、栈 4、队列 5、串 6、多维数组和广义表 7、树和二叉树 ...
数据结构与算法（快速基础C++版）
2024-08-27 16:50

Andrew_Xzw的博客 数据结构与算法（快速基础）
数据结构与算法必知基础知识
2021-01-06 22:58

程序员bigsai的博客原创公众号：bigsai 文章已收录在全网都在关注的数据结构与算法学习仓库欢迎star 前言 数据结构与算法是程序员内功体现的重要标准...为什么学习数据结构与算法？如果你还是学生，那么这门课程是必修的，考研基本也.
数据结构和算法是人工智能的基石
2023-11-08 11:06

herosunly的博客这是一本关于数据结构和算法的书，以Java为描述语言，介绍了计算机编程中常用的数据结构和算法。全书共13章，讲述了常见的数据结构、排序算法、位运算、树、递归、回溯算法、贪心算法、双指针和滑动窗口、BFS和DFS、...
《数据结构》知识点汇总+算法代码总结【全】
2021-08-13 21:53

给个选择的博客写在前面：本文写于吴签时期，在家备考时刷完数据结构王道书之后想着把书中重点梳理汇总一下。本文内容包括但不局限于王道数据结构每章的知识点及其课后习题所涵盖的知识点。本人曾在大三期间打过一些程序设计类比赛...
数据结构与算法（java版）
2023-12-25 19:06

future-2002的博客数据结构是指在计算机中组织和存储数据的方式。它关注数据的逻辑关系、操作和存储方式，以及如何有效地访问和修改数据。...选择合适的数据结构可以提高算法的效率，而好的算法可以更好地利用数据结构的优势。
数据结构基于哈夫曼树的数据压缩算法
2021-01-28 20:59

qetuo03的博客数据结构基于哈夫曼树的数据压缩算法实验目的实验内容实验目的 1.掌握哈夫曼树的构造算法。 2.掌握哈夫曼编码的构造算法。实验内容问题描述输入一串字符串，根据给定的字符串中字符出现的频率建立相应的哈夫曼...
耗时3年写了一本数据结构与算法pdf！开源了
2023-11-11 19:39

程序员bigsai的博客自己写东西断断续续也不少时间了，也写了不少东西(虽然是偏向小白)，这个其实花费的时间还是比较多的，这次的话主要将数据结构与算法中一些文章整理出来，初步整理成一版pdf，先分享给大家。因为在整理pdf方面没啥...
《算法和数据结构》题海战术篇
2021-09-12 06:29

英雄哪里出来的博客刷了 3333 题算法题后的一点点经验总结 —— 题不是这么刷的！
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 9月24日
展开全部