sgxiaoran 2015-05-05 14:08 采纳率: 100%

已采纳

用fputc写的lzw文件后半部分不能读取

参考代码写了一个lzw压缩程序，原先的txt文件4.8k，压缩后成为4.2k。可是无法还原，只能还原前面一部分。我用fgetc一个一个读出数据，发现到第291个数据就终止了，然后vs响15声。这是什么原因？

压缩输出的时候监测输出数据，291后面直到2000+个数据c都是正常的，被用fputc输出。复制粘贴到解压缩文件夹后就出问题了
解压缩的时候在第291个数据处开始读到EOF，之后所有的数据用fgetc读都是EOF。也就是说只有前面291个是正常数据，后面全写了-1进去，生成一个文件

附程序
//4.27添加修改0的模块，并避免溢出情形

#ifndef _COMPRESSDO_H
#define _COMPRESSDO_H
#endif
#include
#include
#include
#include
#include

#include
#include
#include
using namespace std;
#define BOOL int
#define MAX_CODES 4096
#define TRUE 1
#define FALSE 0

#define NOT_USED 0
#define HASH_SIZE 4096
#define VERBOSE 1
#define MAXSTRING 1000

const int BYTE_SIZE = 8;
const int EXCESS = 4;
const int ALPHA= 256;
const int MASK = 15;

int overnum=0;
int bileftOver;
int bitsLeftOver = 0;
int flag;
unsigned int get(unsigned int key,int flag);
int fgetrealc();
unsigned int hash_code(unsigned int key,int flag);
void compress(char *Filename);
int compressdo(char *Filename);
void init_hashtable(void);
void output(unsigned int pcode,int flag);
//void print_binary(int i);
void put(unsigned int key, int flag,unsigned int b);

void output_encode(unsigned int pcode,int flag);

void set_file1(char *file);

struct HASH_TABLE{
unsigned int key;
int flag;
}table[HASH_SIZE];//table是在定义结构体时声明的实例，是一个长为4099的数组
//i是码字，key是字符值，flag代表字符值中前面0的个数

FILE *in, *out; //file point of the source and destination

int q[10];//因为是int，所以要判为>0才能输出
int l=-1;

const int MASK1 = 255;
const int MASK2 = 15;

unsigned int get(unsigned int key,int flag){//判断key是否字符表中已有
unsigned int b = hash_code(key,flag);

if(table[b].key == NOT_USED)
    return NOT_USED;
return b;//两次返回实际上也是一次返回，并列两者只能二选其一并按顺序优先，满足if返回-1，不满足返回下一个

}

unsigned int hash_code(unsigned int key,int flag){//转一圈寻找与key相同的值或者相应-1？并返回相应j；如果始终不满足，就只好返回i
//也就是说，查找key是空字符还是已经定义的字符，并返回字符相应的编号；否则就再用一个新编号
unsigned int i = key%HASH_SIZE;
unsigned int j;
if(i<0)
j=i+HASH_SIZE;
else
j = i;
do{
if((table[j].key == key) & (table[j].flag==flag))
return j;
else
{if( table[j].key == NOT_USED )
return j;}
j = (j+1)%HASH_SIZE;
}while(j!=i);
return j;//这个两重返回是什么意思？实际上是一次返回，当满足a[j]==5，大括号内j返回给外面的j，j再返回给主函数
//如果始终不满足，则只好返回i值
}

void compress(){
int i, codeUsed, ccc,e;
unsigned int pcode, k;

init_hashtable();
for(i=0; i<ALPHA; i++)
    put(i,0,i);

codeUsed = ALPHA;

ccc = fgetrealc();

if(ccc!=EOF){
    pcode = ccc;
    ccc = fgetrealc();
    int j=0;
    while(ccc!=EOF){    
        //j++;
    //cout<<j<<endl;
        if(pcode>16777215 )//避免溢出
            {
                output_encode(pcode,flag);
                j++;
                cout<<j<<endl;
        flag=0;
        pcode=ccc;}
        else{
            if(pcode ==0)
        flag++;
        k = (pcode<<BYTE_SIZE)+ccc;
       e = get(k,flag);
        if(e==NOT_USED)    //not in dictionary                     
            {
            if(codeUsed<MAX_CODES )
                put( k,flag,codeUsed++);
            if(pcode==0)
            output_encode(pcode,flag-1);
            else
                {output_encode(pcode,flag);
            j++;
            cout<<j<<endl;
            }
                flag=0;
                pcode = ccc;
        }   
        else 
            pcode = k;//这里会溢出

        }
        ccc=fgetrealc();
    }
    output_encode(pcode,flag);
                j++;
                cout<<j<<endl;
    if(bitsLeftOver)
        fputc(bileftOver<<EXCESS, out);

}
fclose(in);
fclose(out);

}

void init_hashtable(void){//初始化所有字符为未使用
int i;
for(i=0; i<HASH_SIZE; i++)
{table[i].key = NOT_USED;
table[i].flag=0;}
}

int fgetrealc()
{
int c,code;
int t=0;
if(l {
c = fgetc(in);
// cout if(c == EOF)
{
for(int i=9;i>=0;i--){
q[i]=fgetc(in);
if(q[i]==-1)
t++;
}
if(t==10)
return EOF;
else
l=9;
}

else
{
if(c c+=256;
return c;
}
}
if(l>=0)
{
if(c<0)
c+=256;
code=c;
c=q[l];
l--;
return code;
}
}

void output_encode(unsigned int pcode,int flag){
unsigned int a=0,d=0,p;

p=get(pcode,flag);//这时才转换为12位
/*if(p==-1)
    {cout<<"p==-1"<<endl;
system("pause");}*/
if(bitsLeftOver){
    d = p & MASK1;
    a = (bileftOver << EXCESS)+(p>>BYTE_SIZE);

    //printf("%i - ", c);print_binary(c);
    //printf("%i - ", d);print_binary(d);
    fputc(a, out);

// cout< fputc(d, out);
// cout bitsLeftOver =0;
}
else{
bileftOver = p & MASK2;
a = p>>EXCESS;
//printf("%i - ", c);print_binary(c);
fputc(a, out);
// cout<<ferror(out)<<endl;
bitsLeftOver = 1;
}
}

//for debug used
void print_binary(int i){
int j;
for(j=7; j>=0; j--)
printf("%i", (i>>j)&1);
printf("\n");
}

void put(unsigned int key, int flag,unsigned int b){
// int b = hash_code(key,flag);
if(table[b].key == NOT_USED){
table[b].key = key;
table[b].flag = flag;
return ;
}
else{
if((table[b].key == key) & (table[b].flag==flag)){ //duplicate
//this should not happen
printf("Internal error occur during hashing:duplicate");
exit(1);
}
else{ //table is full
//this should not happen
printf("Internal error occur during hashing:table full");
exit(1);
}
}
}

void set_files1(char *file){

in = fopen(file,"r");
out=fopen("testtxt.lzw","w");

}

long get_file_size( char * filename ) {

    struct stat f_stat; 

    if( stat( filename, &f_stat ) == -1 ){ 
        return -1; 
    } 
    /*int stat(const char *path, struct stat *struct_stat);

int lstat(const char *path,struct stat *struct_stat);

两个函数的第一个参数都是文件的路径，第二个参数是struct stat的指针
这样就获取了文件各种参数存在f_stat里面
返回其中的st_size*/

    return (long)f_stat.st_size; 
}

void printusage (void) {
printf("Usage:lzw -flag source \n");
printf("flag should be encode or decode\n");
printf("When the flag is decode, the source file should be the format of \"*.lzw\" \n");
printf("Example: \"lzw -encode test.c\" ,then the output file would be test.c.lzw \n");
}

/************ Main Function *****************************************************************/
int compressdo(char *Filename){
cout<<"encoding"<<endl;
time_t tm1,tm2;

double filesize1,filesize2,lzwrate;
time(&tm1);
// cout<<ctime(&tm1)<<endl;
filesize1=get_file_size(Filename);
cout<<"filesize1="<<filesize1<<endl;
set_files1(Filename);
compress();
time(&tm2);
cout<<"timecost="<<difftime(tm2,tm1)<<endl;
filesize2=get_file_size("testtxt.lzw");
cout<<"filesize2="<<filesize2<<endl;
lzwrate=filesize1/filesize2;
cout<<"lzwrate="<<lzwrate<<endl;
system("pause");
return(0);
}
/*else if (temp_flag==1) { // decode
printf ("Decoding %s ......\n", argv[2]);
set_files_decode(outname);
tm = time(NULL);
printf(ctime(&tm));
decompress();
tm = time(NULL);
printf(ctime(&tm));
filesize=get_file_size(inname);
printf("%l",filesize);
return(0);
}
printusage();
return(1);
}*/

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
sgxiaoran 2015-05-06 02:39
关注
还原的时候在第291个数据处开始读到EOF，之后所有的数据用fgetc读都是EOF。可输出的时候291后面直到2000+个数据都不是EOF，复制粘贴到还原文件夹后就出问题了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

c语言中关于用fputc输入，打开文件后有乱码怎么解决？ c语言
2020-11-07 10:35

回答 1 已采纳 #include <stdio.h> int main(void){ FILE *fp = NULL; fp = fopen("test.txt","w"); if(fp==NUL
在练习c语言文件读写fputc时遇到文件写出来最后多一个点的问题 c语言
2022-02-21 14:30

回答 1 已采纳 else换成这个试试： else { printf("继续执行"); c_tmp = fgetc(fi_1); while (c_tmp!=EOF)
c语言文件部分习题，找不到哪里错了 c语言
2022-11-26 20:11

回答 2 已采纳回答：关于文件读写，可以参考这个文章：https://www.runoob.com/cprogramming/c-file-io.html 代码如下（魔改了一部分，因为我对于C语言的一些库函数也不是特
LZW编码
2022-04-24 00:20

BIN_markie的博客一、概述 LZW的编码思想是不断地从字符流中提取新的字符串，通俗地理解为新 “ 词条 ” ，然后用 “ 代号 ”... LZW编码器的输入是字符流，字符流可以是用 8 位 ASCII 字符组成的字符串，而输出是用 n 位 ( 例如 ...
简单的文件读写，存入的数据与第二次读取的数据不一致，如何解决？ c语言开发语言
2022-04-09 10:40

回答 2 已采纳数据写入和读取是合在一个程序里运行的吗？
C语言读取文件内容到另一个文件 c语言有问必答
2021-08-25 21:20

回答 3 已采纳用fgetc也太啰嗦了，可以直接文件内容读取，再全部写入，另外二进制文件读写得用rb,wb #include<stdio.h> int main() { char ch; FILE
文件包含不能在当前代码页中表示的字符 c++ c语言
2020-02-22 19:57

回答 1 已采纳 fp = fopen_s(&fp,"C:\\Users\\jyz_1\\Desktop\\知识集锦\\预处理.txt", "w+"); //这里换成w+ 另外检查这个路径是否正确你可以用记事
使用C++实现LZW 编解码算法(更新过)
2021-04-21 19:09

黑色糖渣的博客 1、LZW算法简介2、简易流程图3、LZW压缩的特点二、使用C++实现LZW 编解码算法1、逻辑结构分析2、使用C++实现LZW编码3、使用C++实现LZW解码4、完整代码5、结果三、压缩效率分析1、.txt文件的压缩效率分析2、.jpeg文件...
c语言文件读写问题，每次写入文件指针就出现错误
2017-03-28 00:12

回答 4 已采纳你打开文件写入文件之后,文件流指针指向末尾,读取的时候从当前文件流指针位置读取,当然读取不到东西, 把文件关闭重新rb 打开,或者重新定位文件流指针
c语言对文件的写入为什么不成功 c语言
2022-06-03 00:14

回答 3 已采纳修改处见注释，供参考： #include<stdio.h> #include<stdlib.h> int main() { FILE *fp1; int e
c图片文件读取问题，坐等大神
2014-06-30 03:07

回答 1 已采纳图片一般是二进制的，用fread/fwrite接口，并用二进制读写模式就可以了。fgetc/fputc更多的是处理文本的。
2022大三下学期数据压缩实验 LZW算法原理及实现
2022-04-21 22:02

LZW算法原理及实现 LZW算法是一种常用的无损压缩算法，广泛应用于数据压缩领域。下面是LZW算法的原理及实现： 1. LZW编码基本思想 LZW编码的基本思想是将输入的字符流转换为索引流。该算法首先对输入的所有单个...
C语言实现LZW编码
2021-04-20 20:11

weixin_45101561的博客 LZW编码算法思想首先我们有一个0到255的ASCII码表，然后得到若干字符串对其进行编码，再对编码后的码流进行解码以验证。编码：初始化：前缀P为空，第一个字符进入后缀C 判断：P+C（P为a，C为b时，P+C为ab）是否...
LZW算法
2022-06-05 12:00

jehhdhdd的博客 LZW的编码思想是不断地从字符流中提取新的字符串，然后用码字表示这个新字符串。这样用码字去替换字符流，生成码字流，可以达到压缩数据的目的。步骤1：将词典初始化为包含所有可能的单字符（常用ASCII码表），当前...
【数据压缩】--LZW算法
2022-04-20 22:51

m0_54222259的博客文章目录LZW算法原理LZW编码编码算法的思想数据结构分析主要功能模块初始化词典查找词典中是否有字符串将新串加入词典...文件的压缩效率更改词典总数上限后的编码效率字符重复率很高的文本文档LZW算法的优缺点程序代码...
【数据压缩】LZW编解码原理及算法实现
2022-04-21 22:13

spadeK2020的博客 LZW压缩（LZW compression）是一种由Abraham Lempel、Jacob Ziv和Terry Welch发明的基于表查寻算法把文件压缩成小文件的无损压缩方法。二、LZW编解码举例 1、LZW编码算法思想举例：输入流 a b b a b a b a c ...
【数据压缩】C++实现LZW算法编解码
2021-04-22 21:45

3木目的博客选择十种不同格式类型的文件，使用LZW编码器进行压缩得到输出的压缩比特流文件。对各种不同格式的文件进行压缩效率的分析。二、实验内容（1）实验思路 1．LZW编码原理和实现算法 LZW的编码思想是不断地从字符流中...
数据压缩实验三：LZW编解码算法实现
2022-07-14 21:13

早悟兰因丷的博客 1.1LZW的编码思想不断地从字符流中提取新的字符串，通俗地理解为新“词条”，然后用“代号”也就是码字表示这个“词条”。这样一来，对字符流的编码就变成了用码字去替换字符流，生成码字流，从而达到压缩数据的目的...
数据压缩作业五：LZW编解码
2022-07-07 15:34

你没事吧.的博客 LZW编解码算法实现与分析
LZW词典编码原理及代码实现
2022-07-10 15:55

不会编程的芝麻张的博客数据压缩作业：LZW词典编码原理
没有解决我的问题, 去提问

悬赏问题

¥30 STM32 INMP441无法读取数据
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥15 各位帮我看看如何写代码，打出来的图形要和如下图呈现的一样，急
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error
¥15 VS2022+WDK驱动开发环境

用fputc写的lzw文件后半部分不能读取

4条回答 默认 最新

悬赏问题

4条回答默认最新