修改程序：信源编解码（c语言）

修改程序：问题1。源文件source文本空间太长汉字太多无法运行2，未按频度要求排序

问题描述：
信源编解码是通信系统的重要组成部分。本实验旨在通过程序设计实现基于哈夫曼编码的信源编解码算法。程序具备以下功能：
对于给定的源文档 SourceDoc.txt，
1) 统计其中所有字符的频度（某字符的频度等于其出现的总次数除以总字符数），
包括字母（区分大小写）、标点符号及格式控制符（空格、回车等）。
2) 按频度统计结果生成哈夫曼编码码表。
3) 基于哈夫曼码表进行编码，生成对应的二进制码流，并输出到文件 Encode.dat。

4) 对二进制码流进行哈夫曼解码，把结果输出到文件 DecodeDoc.txt。
5) 判断DecodeDoc.txt与SourceDoc.txt内容是否一致，以验证编解码系统的正确性。

要求：
1) 用 C 语言实现。
2) 用子函数实现各功能模块。
3) 输出文件 Statistic.txt，包含的信息有：按频度大小排序的字符表，及各字符出现
的次数、频度及哈夫曼编码。
4) 应至少包含链表、二叉树的数据结构。
5) 不能用冒泡排序算法。

#include
#include
#include
#include
#include
#include
#include
#include

#define N 10000

int count = 0; //每增加一个新的字符, count增加1, 可表示a中的字符种类数, 也即哈夫曼树叶子点个数

/*定义哈夫曼树结构体*/
typedef struct HuffmanTree{
int weight;
int parent;
int Lchild;
int Rchild;
}HuffmanTree[2*N];

/*定义储存字符及其出现次数的结构体*/
typedef struct DifferentCharacter{
char char_date;
int num; //相同字符出现的次数
char a_code[100]; //每种字符对应的编码
}difcha[N];

/*在一定范围内选择两个weight最小的结点, 并将两个结点的序号赋给s1, s2*/
void select_two(HuffmanTree ht, int j, int *s1, int *s2) {
int i = 1, temp;
int min1 = 0, min2 = 0;
while( (ht[i].parent != 0) && (i <= j) )
i++;
*s1 = i;
min1 = ht[i++].weight;

while( (ht[i].parent != 0) && (i <= j) )
i++;
*s2 = i;
min2 = ht[i++].weight;

if(min1 > min2){
temp = min1;
min1 = min2;
min2 = temp;
}

for(; i <= j; i++){ //遍历parent不为0的结点
if(ht[i].parent != 0)
continue;
if(ht[i].weight <= min1){
min2 = min1;
min1 = ht[i].weight;
*s2 = *s1;
*s1 = i;
}
else if( (ht[i].weight < min2) && (ht[i].weight > min1) ) {
min2 = ht[i].weight;
*s2 = i;
}
}
}

/*建哈夫曼树*/
void EstHuffmanTree(HuffmanTree ht, int *w, int n){
int i;
int s1 = 0, s2 = 0;
for(i = 1; i <= n; i++){ //初始化哈夫曼树, 前n个单元存放叶子点
ht[i].weight = w[i];
ht[i].parent = 0;
ht[i].Lchild = 0;
ht[i].Rchild = 0;
}
for(i = n+1; i <= 2*n-1; i++){ //后n-1个单元存放非叶子点
ht[i].weight = 0;
ht[i].parent = 0;
ht[i].Lchild = 0;
ht[i].Rchild = 0;
}

for(i = n+1; i <= 2*n-1; i++){
select_two(ht, i-1, &s1, &s2); //创建非叶子点, 建立哈夫曼树, 每次在ht[1]~ht[i-1]范围内选两个最小的weight结点,并将其序号赋给s1, s2

ht[i].weight = ht[s1].weight + ht[s2].weight;
ht[i].Lchild = s1;
ht[i].Rchild = s2;
ht[s1].parent = i;
ht[s2].parent = i;

} //哈夫曼树建立完毕
}

/*求哈弗曼编码*/
void CrtHuffmanCode(HuffmanTree ht, char **hcd, int n){
int start = 0, c = 0, p = 0, i;
char cd = (char)malloc(n*sizeof(char)); //分配求当前编码的工作空间
cd[n-1] = '\0'; //从左向右存放编码
for(i = 1; i <= n; i++) {
start = n-1; //初始化编码起始指针
c = i;
p = ht[i].parent;
while(p != 0){
start--;
if(ht[p].Lchild == c)
cd[start] = '0'; //左分支标0
else
cd[start] = '1'; //右分支标1

  c = p;                      //向上倒推                      
  p = ht[c].parent;
}
hcd[i] = (char*)malloc((n-start)*sizeof(char));
strcpy(hcd[i], &cd[start]);

}
free(cd);
}

/*自定义错误处理函数*/
void my_err(char *err_string, int line){
printf("Line %d:\n", line);
perror(err_string);
exit(1);
}

/*从 buf_read 中统计每个字符出现的次数,将次数作为该字符的权值*/
void Statistics(difcha a, char *buf_read){
int i, j = 0;

for(i = 0; i < strlen(buf_read) ; i++){ //对buf_read中的字符遍历
for(j = 0; j < count; j++){ //检查是否是新的字符
if(a[j].char_date == buf_read[i]){
a[j].num++; //若是旧字符, 则num++;
break;
}
}
if(j == count){ //若是新字符, 则记录到a中, 且对应的num++
a[count].char_date = buf_read[i];
a[count].num++;
count++; //更新count
}
}
}

/*从 SourceDoc.txt 读取数据到 buf_read */
void ReadFile(char *pathName, char *buf_read){
int fd_date;
int len = 0;

if( (fd_date = open(pathName, O_RDWR)) < 0) //以读写方式打开SourceDoc.txt文件
my_err("open SourceDoc.txt", LINE);

if(lseek(fd_date, 0, SEEK_END) < 0) //获取文件长度,并保持文件读写指针在文件开始处
my_err("lseek", LINE);
if( (len = lseek(fd_date, 0, SEEK_CUR)) < 0 )
my_err("lseek", LINE);
if(lseek(fd_date, 0, SEEK_SET) < 0)
my_err("lseek", LINE);

if(read(fd_date, buf_read, len) > len) //从SourceDoc.txt中读取内容
my_err("read SourceDoc.txt", LINE);
}

/*将 buf_code 写入 Encode.dat 中*/
void WriteFile(char *pathName, char *buf_code){
int fd_code;

if((fd_code = open(pathName, O_CREAT|O_TRUNC|O_RDWR, S_IRWXU)) < 0) //创建Encode.dat文件
my_err("open Encode.dat", LINE);
if( write(fd_code, buf_code, strlen(buf_code)) != strlen(buf_code) ) //将 buf_code 写入Encode.dat
my_err("write Encode.dat", LINE);
}

/*主函数*/
void main(){
char buf_read[N] = {'\0'};
char buf_code[N] = {'\0'};
char buf_yima[N] = {'\0'};
char *hcd[N];
char temp[50] = {'\0'};
difcha a;
int i, j, n, k = 0, m = 0;
int w[N] = {0};
HuffmanTree ht;

ReadFile("SourceDoc.txt", buf_read);
Statistics(a, buf_read);
for(i = 0; i < count; i++)
w[i+1] = a[i].num;
EstHuffmanTree(ht, w, count); //建HuffmanTree
CrtHuffmanCode(ht, hcd, count); //对树中字符进行编码
for(i = 1; i <= count; i++) //将每个字符对应的编码存入结构体 a 中
strcpy(a[i-1].a_code, hcd[i]);

FILE *fp1;
fp1=fopen("Statistic.txt","w");
for(i = 0; i < count; i++) //查看每个字符的权值和对应的编码
fprintf(fp1,"%c %d %s\n", a[i].char_date, a[i].num, a[i].a_code);
fclose(fp1);

for(i = 0; i < strlen(buf_read) ; i++){ //遍历 buf_read, 给 SourceDoc.txt 中每个字符匹配编码, 存入 buf_code 中
for(j = 0; j < count; j++){

if(buf_read[i] == a[j].char_date){
strcat(buf_code, a[j].a_code);
break;
}
}
if(j == count) //匹配异常
printf("Unknown Character: %c\n", buf_read[i]);
}

WriteFile("Encode.dat", buf_code); //将 buf_code 写入 Encode.dat 中

ReadFile("Encode.dat", buf_read); //从 Encode.dat 中读取全部编码
n = strlen(buf_read);
for(i = 0; i < n; i++){ //为 Encode.dat 中的编码匹配字符
temp[k++] = buf_read[i];
for(j = 0; j < count; j++){
if(strcmp(temp, a[j].a_code) == 0){
buf_yima[m++] = a[j].char_date;
break;
}
}
if(j < count){ //匹配成功, 对 temp 初始化
for(;k > 0; k--)
temp[k] = '\0';
}
}

FILE *fp2;
fp2=fopen("DecodeDoc.txt","w");
fprintf(fp2,"%s", buf_yima);
fclose(fp2);
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2019-12-28 00:26
关注
https://www.cnblogs.com/xbfxjtuedu/p/10055097.html 参考下这个吧。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用python语言表达 python
2021-07-21 10:08

回答 1 已采纳 import math def fun(px): return px*math. log(px,2)
Matlab-Simulink通信系统建模仿真 matlab 开发语言
2022-07-03 22:32

回答 1 已采纳信源模块选错了，不是用BSC，更换成下面这个再按你的测试代码可以计算出误码率： clc,clear,close all; x = 0:0.051:0.1; y = x; %预定义y for i=1:l
关于#matlab#的问题，如何解决？ matlab
2023-03-18 08:57

回答 7 已采纳还请看一下这个
信源编码程序设计实验C语言实现,霍夫曼信源编码实验报告
2021-05-21 03:06

信徒阿布的博客霍夫曼信源编码实验报告 1 实验 1：霍夫曼信源编码综合设计【实验目的】通过本专题设计，掌握霍夫曼编码的原理和实现方法，并熟悉利用 C 语言进行程序设计，对典型的文本数据和图像数据进行霍夫曼编解码。...
matlab算法实现改进的香农编码 matlab
2023-03-12 19:42

回答 7 已采纳该回答引用ChatGPT 如有疑问，可以回复我！运行结果代码如下： % 定义信源符号及其对应的概率 source = ['A', 'B', 'C', 'D', 'E']; prob = [0
运行结果有误，但不知道哪部分代码存在问题，希望您能够指正帮助！谢！ matlab
2022-04-18 17:13

回答 1 已采纳粗略看了一眼信源代码生成不对，Line17和18，改成S1 = randn(1, n) ;阵列流型矩阵生成不对，Line20~22indexA = sort(unique([(0:1:2*M-1).
请问一下，这个代码的问题可以怎样解决，结果如图所示 matlab 算法
2023-04-03 21:32

回答 2 已采纳 sym2poly你是不是拼错了
信源压缩编码编程c语言,霍夫曼信源编码实验报告.docx
2021-05-20 14:30

PEI Lobster的博客霍夫曼信源编码实验报告.docxPAGEPAGE 7实验1：霍夫曼信源编码综合设计【实验目的】通过本专题设计，掌握霍夫曼编码的原理和实现方法，并熟悉利用C语言进行程序设计，对典型的文本数据和图像数据进行霍夫曼编解码。...
请问一下这个代码为什么显示这个问题,显示结果为什么会这样 matlab 算法
2023-04-03 20:28

回答 1 已采纳问你自己啊，Rxx=X1*X1'/n;%计算协方差矩这里X1在哪里来的
信源编码程序设计实验C语言实现,霍夫曼信源编码实验报告.docx
2021-05-21 03:05

猫八十的博客实验1：霍夫曼信源编码综合设计【实验目的】通过本专题设计，掌握霍夫曼编码的原理和实现方法，并熟悉利用C语言进行程序设计，对典型的文本数据和图像数据进行霍夫曼编解码。【预备知识】1、熵的概念，霍夫曼编码...
Huffman编码与解码_C语言实现
2017-04-16 10:22

vacu_um的博客哈夫曼编码(Huffman Coding)，是一种编码方式，哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异...本次实验用C语言实现了Huffman编码器、Huffman解码器。
霍夫曼编码及解码实验c语言,Huffman编码与解码_C语言实现
2021-05-20 19:21

weixin_39557087的博客 1.5 Huffman编码基于信源的概率统计模型，它的基本思路是，出现概率大的信源符号编长码，出现概率小的信源符号编短码，从而使平均码长最小。 1.6 在程序实现中常使用一种叫做树的数据结构实现Huffman编码，由它编...
Huffman树压缩程序（c实现）
2018-12-02 20:32

weixin_30411819的博客本实验旨在通过程序设计实现基于哈夫曼编码的信源编解码算法。程序具备以下功能：对于给定的源文档SourceDoc.txt，　1)统计其中所有字符的频度（某字符的频度等于其出现的总次数除以总字符数），包括字母（区分...
huffman编码的程序流程图_信源编码实验报告【Huffman编解码实验报告】
2020-12-29 08:24

weixin_39707478的博客文本文件的二进制预统计Huffman编解码一、实验目的(1) 熟悉Huffman编解码算法；(2) 理解Huffman编码的最佳性。二、实验内容1、编程思想霍夫曼(Huffman)编码是1952年为文本文件而建立，是一种统计编码。属于无损压缩...
哈夫曼信源编码c语言程序代码
2010-01-09 22:36

哈夫曼信源编码c语言程序代码内有编程思路和提示希望对大家有帮助
【数据压缩】LZW编解码原理及算法实现
2022-04-21 22:13

spadeK2020的博客二、LZW编解码举例 1、LZW编码算法思想举例：输入流 a b b a b a b a c 首先，以ASCII码为基础词典已编码：a b 遇到a，用97表示，编码为97。遇到b，用98表示，编码为98。发现ab，加入词典，ab索引为256。 ...
c语言编写算术编码,编程实现算术编码算法.doc
2021-05-20 04:16

凳子独立开发的博客掌握C语言编程(尤其是数值的进制转换，数值与字符串之间的转换等)四、实验要求提前预习实验，认真阅读实验原理。认真高效的完成实验，实验过程中服从实验室管理人员以及实验指导老师的管理。认真填写...
C语言与嵌入式安全：固件保护、安全启动与安全更新机制（一）
2024-04-19 10:07

JJJ69的博客 C语言作为一种结构化、低级且贴近硬件的编程语言，长期以来在嵌入式系统开发中占据着无可替代的重要地位。其简洁明了的语法、高效的执行效率、对底层硬件资源的直接操控能力，以及广泛的编译器支持，使得C语言成为...
哈夫曼编码的 C 语言实现
2016-08-14 10:44

哈夫曼编码是一种无损的高效的压缩方法。对文本文件进行哈夫曼编码，使用计算信源熵打开一个文件进行概率计算，然后将输出的 submit.txt 文件用哈夫曼编码打开，之后就会对文本文件中出现的字符进行哈夫曼编码。
哈夫曼编码 Huffman code（C语言实现）
2022-10-21 21:37

Frank.23的博客对英文文本文件进行读取，统计字符出现的频率，并根据频率创建哈夫曼编码。将文本文件编码成编码文件，并能够实现从编码文件中读出原来的文本文件。
没有解决我的问题, 去提问

悬赏问题

¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛