文本文件操作的综合性实验

在当前目录中存在文件名为"case1.in"（其中case后为数字1，不是字母l，写错提交后会判错）的文本文件，
其内容为一篇英文文章（以EOF作为结束标志）。现要求读取该文本文件内容，统计文章中每个单词出现的次数，
并输出出现次数最多的前5个单词及其出现次数（按出现次数由多到少的顺序输出，次数相同时按字典顺序输出，
不足5个单词时，按序输出全部单词）。程序中注意如下细节：
（1）空格、标点符号与回车符起到分隔单词的作用。
（2）文章一行的末尾可能有连字符，出现连字符时，该行最末的字符串与下行最先出现的字符串构一个单词；
（3）名词缩写算一个单词；
（4）数字不算单词；
（5）单词不区分大小写；
（6）输出时单词全使用小写；
I am a student. My school is SCAU. It is a beau-
tiful university. I like it.
I am a student. My school is SCAU. It is a i-
s university. I like it.
1 2 3 4 5 6 7 8 9
12 12 12 12
jI I
我的代码统计I的数量为什么是错误的？应该怎么修改


```c
#include "stdio.h"
#include "math.h"
#include "string.h"
#include "stdlib.h"

struct wordstore
{
    char c[20];
    int num;  //重复次数
} word[10000];

main()
{
    FILE*fp=fopen("case1.in","r");   //以下操作是把文件中的所有单词存进结构体数组里
    if(fp==NULL)
    {
        perror("fopen");
        return 0;
    }
    char ch,w[20];     //w用来储存取出的一个单词
    int i=0,flag=0;    //i是表示存入一个单词时的下标
    int k=0;  //从文件中取出单词的数量
    int j=0;  //用于遍历文件取出的单词下标
    while((ch=fgetc(fp))!=EOF)
    {
        if(ch>='A'&&ch<='Z')
            ch=ch+32;
        if(ch>='a'&&ch<='z')
        {
            w[i++]=ch;
            flag=1;       //有单词
        }
        else   //录入的不是单词
        {
           /* if(ch=='-'&&(ch=fgetc(fp))=='\n')
               {
                   flag=0;      //单词还没有结束
                   fseek(fp,-1,SEEK_CUR);
               }
            */
            if(ch=='-')
            {
                char ch1=fgetc(fp);
                if(ch1=='\n')
                {
                  flag=0;
                }
                else
                {
                    fseek(fp,-1,SEEK_CUR);
                }
            }
            if(flag==1&&i!=0)   //一个单词结束了
            {
                w[i]='\0';
                for(j=0; j<k; j++) //取出的所有单词遍历
                {
                    if(strcmp(w,word[j].c)==0)   //有相同的单词
                    {
                        word[j].num++;
                        break;
                    }
                }
                //没有相同的即为新单词，个数置为1，把w储存的单词复制给结构体
                if(j==k)
                {
                    word[k].num=1;
                    strcpy(word[k++].c,w);
                }
                i=0;flag=0;
            }
        }
    }
    //输出出现次数最多的5个单词
    for(i=0; i<k-1; i++) //冒泡排序，使其降序排列
    {
        for(j=0; j<k-1-i; j++)
        {
            if(word[j+1].num-word[j].num>0||(word[j+1].num==word[j].num&&strcmp(word[j+1].c,word[j].c)<0))
            {
                struct wordstore tmp = word[j];
                word[j] = word[j + 1];
                word[j + 1] = tmp;
            }


        }
    }
    for(i=0; i<5; i++)
    {
        printf("%s %d\n",word[i].c,word[i].num);
    }
    fclose(fp);
    return 0;
}

```

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

码农阿豪@新空间新星创作者: 前端开发技术领域 2024-03-25 21:01

关注

让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言

问题描述：我的代码统计I的数量为什么是错误的？应该怎么修改？代码解答：问题代码中将单词都转换为小写字母进行统计，但是题目要求不区分大小写，因此需要在统计时将输入的单词转为小写字母，再进行比较。修改代码如下：

struct wordstore{
    char c[20];
    int num;
} word[10000];
//大写字母转小写字母
char tolower(char c){
    if(c >= 'A' && c <= 'Z'){
        return c - 'A' + 'a';
    }
    return c;
}
main(){
    FILE*fp=fopen("case1.in","r");
    ...
    char ch,w[20];
    int i=0,flag=0;
    int k=0; //从文件中取出单词的数量
    int j=0; //用于遍历文件取出的单词下标
    while((ch=fgetc(fp))!=EOF)
    {
        ch = tolower(ch);  //转换为小写字母
        ...
    }
    //输出出现次数最多的5个单词
    for(i=0; i<k-1; i++) //冒泡排序，使其降序排列
    {
        for(j=0; j<k-1-i; j++)
        {
            if(word[j+1].num-word[j].num>0 || (word[j+1].num==word[j].num && strcmp(word[j+1].c,word[j].c)<0))
            {
                struct wordstore tmp = word[j];
                word[j] = word[j + 1];
                word[j + 1] = tmp;
            }
        }
    }
    for(i=0; i<5 && i<k; i++) //注意不足5个单词时，按序输出全部单词
    {
        printf("%s %d\n",word[i].c,word[i].num);
    }
    return 0;
}

报告相同问题？

关注问题

大数据实验四-MapReduce编程实践
2024-04-03 11:45

2. **实现统计HDFS系统中多个文本文件中的单词出现频率**：通过实际操作，体验MapReduce在处理大数据集时的高效性。 #### 二、实验过程详解 ##### 1. 在本地创建多个文本文件并上传到Hadoop - **创建本地存放文件...
实验十一综合实验(文本编辑器)（文档中包含可执行源码）
2023-03-13 11:57

【实验十一综合实验(文本编辑器)】是一个面向对象程序设计的实践项目，旨在让学生运用Java语言的各类核心特性来实现一个简化版的文本编辑器。这个实验旨在提升学生对Java编程的整体认识，强化面向对象编程的能力，...
41.数据流驱动的编程语言.doc-综合文档
2021-05-23 17:36

数据流驱动的编程语言是一种与传统的面向过程编程思想不同的编程范式，它的核心在于程序的执行依赖于数据的可用性，而不是固定的控制流。在面向过程编程中，代码的执行通常按照预先定义的顺序进行，程序员需要明确地...
文件操作和网络编程实验
2015-05-10 13:40

### 文件操作和网络编程实验知识点解析 #### 一、实验目的本次实验旨在帮助学习者掌握文件读写方法以及网络相关类的使用。具体来说，包括以下两个方面： 1. **文件读写的方法**：通过编写Java程序来实现对文件的...
基于Java与多语言融合的wiki实验设计源码
2024-10-10 01:14

Java是一种广泛使用的编程语言，以其“一次编写，到处运行”的特性著称。它在企业级应用开发中占有重要地位，尤其擅长于处理网络通信、数据存储和大型系统设计。Vue是一个渐进式JavaScript框架，用于构建用户界面，...
《Java语言程序设计》课程实验报告五输入输出流
2025-07-15 12:42

本次实验是一个综合性的实践课程，不仅锻炼了学生们的动手能力，还让他们在解决具体问题的过程中加深了对Java编程语言的理解，特别是对Java文件操作的深入认识。通过一系列的操作和问题解决，学生能够更熟练地运用...
基于Java语言的实验设计源码
2024-10-03 04:35

集合中的10个文本文件可能包含了实验报告、设计说明、需求分析等文档，为学习者提供了书写规范和技术文档的范例，同时也是软件开发过程中不可或缺的组成部分。2个Markdown文件的加入，则为文档编写提供了更为简洁和...
Linux综合性实验.doc
2024-05-15 08:16

本次实验是针对华北科技学院计算机学院的学生设计的一次综合性实验，旨在通过实践加深学生对Linux操作系统及其相关技术的理解和应用能力。实验主要围绕进程调度展开，具体包括自动化任务的设置、脚本编写与调试等...
综合性实验 c# .net 多文档编辑器源码代码详细报告
2013-09-05 15:15

在本综合实验中，我们关注的是使用C#和.NET框架构建一个功能丰富的多文档编辑器。这个项目旨在提升开发者在Windows应用程序开发中的技能，特别是处理文本编辑和用户界面设计的能力。我们将深入探讨C#编程语言的关键...
实验四（多文档文本编辑器）.zip
2021-03-03 07:56

【标题】：“实验四（多文档文本编辑器）”是一个基于C#编程语言和Visual Studio开发环境的程序设计项目，旨在实现一个支持多文档界面的文本编辑器。这个实验主要涵盖了Windows Forms应用程序的基础构建，控件使用，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月25日

文本文件操作的综合性实验

3条回答 默认 最新

问题事件

3条回答默认最新