500个英文单词统计词频，但是txt文本只能放大概10个单词才能运行，多了会出现这样的错误


#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<ctype.h>
#pragma warning(disable:4996)

#define MAX 30//取决于最长单词长度
#define SIZE 20000//取决于不重复单词个数
typedef struct word {
    char words[MAX];
    int count;
}word;//存放单词及其频数
int first(word* w[], char* single, int n);
void putin(char* str, word* w[], int i, int n);
int handle(FILE* fp, word* w[]);
void Sort(word* w[], int n);
void Swap(word* w1, word* w2);
void show(word* w[], int n);

int main(int argc, char* argv[])
{
    int n, i;//n代表不重复单词的总数 
    FILE* fp;
    word* w[SIZE];

    if (argc == 1)
    {
        printf("No filed name entered, strike any key to exit.\n");
        getchar();
        exit(0);
    }
    if ((fp = fopen(argv[1], "r")) == NULL)
    {
        printf("Cannot open %s.\n", argv[1]);
        getchar();
        exit(1);
    }
    n = handle(fp, w);
    Sort(w, n);
    show(w, n);
    fclose(fp);
    for (i = 0; i < n; i++)
        free(w[i]);

    return 0;
}
int first(word* w[], char* single, int n)
//判断单词是否第一次出现
//返回i代表重复单词在结构体数组中的位置，返回-1代表第一次出现 
{
    int i;
    if (n == 0)
        return -1;
    else
        for (i = 0; i < n; i++)
            if (strcmp(w[i]->words, single) == 0)//strcmp函数用于判断两个字符串是否相等
                return i;

    return -1;
}

void putin(char* str, word* w[], int i, int n)
//将单词存放结构体中 
//首次出现的单词存放进新的数组，重复出现的使对应频数+1 
//n代表不重复单词的总数 
{
    int t = 0;

    if (i == -1)//不重复单词
    {
        while (str[t] != '\0')
        {
            w[n]->words[t] = str[t];
            t++;
        }
        w[n]->words[t] = '\0';
        w[n]->count = 1;
    }
    else//重复单词
        w[i]->count++;
}

int handle(FILE* fp, word* w[])
//将文件中的字符处理成单词（大写将全部转换成小写 
{
    int i = 0, n = 0;
    char ch, bh = 0;//bh用于处理单词中含有单引号的情况 
    char single[MAX] = { 0 };

    while ((ch = fgetc(fp)) != EOF)
    {
        if (!isalpha(ch))//遇到下一个非字母字符后，重置bh
            bh = 0;
        if (isalpha(ch) && bh != 0)//当bh不为零且ch是字母时，说明当前字符处于单引号之后，跳过本次循环
            continue;
        if (!isalpha(ch) && ch != '-')//遇到非字母字符且该字符不为连字符时跳过本次循环
            continue;
        i = 0;
        while (isalpha(ch) || ch == '-')
        {
            if (ch >= 'A' && ch <= 'Z')//将大写字母全部转换成小写字母 
                ch += 32;
            single[i++] = ch;
            ch = fgetc(fp);
        }
        single[i] = '\0';//手动添加'\0' 
        if (ch == '\'')//处理单引号后面的字母序列 
            bh = ch;
        w[n] = (word*)malloc(sizeof(word));
        if (first(w, single, n) == -1)//first函数用于判断single是否第一次出现
            n++;//n代表不重复的单词的总数 
        putin(single, w, first(w, single, n), n - 1);//putin函数用于将该字符串的相关数据保存进w中 
    }

    return n;
}

void Swap(word* w1, word* w2)
//交换两个结构体
{
    word w;
    strcpy(w.words, w1->words);
    w.count = w1->count;
    strcpy(w1->words, w2->words);
    w1->count = w2->count;
    strcpy(w2->words, w.words);
    w2->count = w.count;
}

void Sort(word* w[], int n)
//将单词按频数进行排序
//频数相同的按字典序排序 
{
    int i, j, f;//f作为标志

    for (i = 0; i < n - 1; i++)
    {
        f = 1;
        for (j = 0; j < n - 1; j++)
        {
            if (w[j]->count < w[j + 1]->count)//比较频数
            {
                Swap(w[j], w[j + 1]);
                f = 0;
            }
            else if (w[j]->count == w[j + 1]->count)//频数相同则按字典序排序 
            {
                if (strcmp(w[j]->words, w[j + 1]->words) > 0)//比较字符串大小（字典序），大于0说明前者比后者大
                    Swap(w[j], w[j + 1]);
                f = 0;
            }
        }
        if (f == 1)//f==1说明上述排序已经完成，可提前终止 
            break;
    }
}

void show(word* w[], int n)
//输出
{
    int i;
    for (i = 0; i < n; i++)
        fprintf(stdout, "%d:%s\n", w[i]->count, w[i]->words);
    printf("打印成功！");
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

fuill 2022-01-07 12:49

关注

试试这样，D盘建一个文件text.txt，用文件目录的方式打开文件
测试可以用的

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<ctype.h>
#pragma warning(disable:4996)
#define MAX 30//取决于最长单词长度
#define SIZE 20000//取决于不重复单词个数
typedef struct word
{
    char words[MAX];
    int count;
} word; //存放单词及其频数
int first(word* w[], char* single, int n);
void putin(char* str, word* w[], int i, int n);
int handle(FILE* fp, word* w[]);
void Sort(word* w[], int n);
void Swap(word* w1, word* w2);
void show(word* w[], int n);
int main()
{
    int n, i;//n代表不重复单词的总数
    FILE* fp;
    word* w[SIZE];
    /*if (argc == 1)
    {
        printf("No filed name entered, strike any key to exit.\n");
        getchar();
        exit(0);
    }*/
    if ((fp = fopen("D:\\text.txt", "r")) == NULL)
    {
        printf("Cannot open \n");
        getchar();
        exit(1);
    }
    n = handle(fp, w);
    Sort(w, n);
    show(w, n);
    fclose(fp);
    for (i = 0; i < n; i++)
        free(w[i]);
    return 0;
}
int first(word* w[], char* single, int n)
//判断单词是否第一次出现
//返回i代表重复单词在结构体数组中的位置，返回-1代表第一次出现
{
    int i;
    if (n == 0)
        return -1;
    else
        for (i = 0; i < n; i++)
            if (strcmp(w[i]->words, single) == 0)//strcmp函数用于判断两个字符串是否相等
                return i;
    return -1;
}
void putin(char* str, word* w[], int i, int n)
//将单词存放结构体中
//首次出现的单词存放进新的数组，重复出现的使对应频数+1
//n代表不重复单词的总数
{
    int t = 0;
    if (i == -1)//不重复单词
    {
        while (str[t] != '\0')
        {
            w[n]->words[t] = str[t];
            t++;
        }
        w[n]->words[t] = '\0';
        w[n]->count = 1;
    }
    else//重复单词
        w[i]->count++;
}
int handle(FILE* fp, word* w[])
//将文件中的字符处理成单词（大写将全部转换成小写
{
    int i = 0, n = 0;
    char ch, bh = 0;//bh用于处理单词中含有单引号的情况
    char single[MAX] = { 0 };
    while ((ch = fgetc(fp)) != EOF)
    {
        if (!isalpha(ch))//遇到下一个非字母字符后，重置bh
            bh = 0;
        if (isalpha(ch) && bh != 0)//当bh不为零且ch是字母时，说明当前字符处于单引号之后，跳过本次循环
            continue;
        if (!isalpha(ch) && ch != '-')//遇到非字母字符且该字符不为连字符时跳过本次循环
            continue;
        i = 0;
        while (isalpha(ch) || ch == '-')
        {
            if (ch >= 'A' && ch <= 'Z')//将大写字母全部转换成小写字母
                ch += 32;
            single[i++] = ch;
            ch = fgetc(fp);
        }
        single[i] = '\0';//手动添加'\0'
        if (ch == '\'')//处理单引号后面的字母序列
            bh = ch;
        w[n] = (word*)malloc(sizeof(word));
        if (first(w, single, n) == -1)//first函数用于判断single是否第一次出现
            n++;//n代表不重复的单词的总数
        putin(single, w, first(w, single, n), n - 1);//putin函数用于将该字符串的相关数据保存进w中
    }
    return n;
}
void Swap(word* w1, word* w2)
//交换两个结构体
{
    word w;
    strcpy(w.words, w1->words);
    w.count = w1->count;
    strcpy(w1->words, w2->words);
    w1->count = w2->count;
    strcpy(w2->words, w.words);
    w2->count = w.count;
}
void Sort(word* w[], int n)
//将单词按频数进行排序
//频数相同的按字典序排序
{
    int i, j, f;//f作为标志
    for (i = 0; i < n - 1; i++)
    {
        f = 1;
        for (j = 0; j < n - 1; j++)
        {
            if (w[j]->count < w[j + 1]->count)//比较频数
            {
                Swap(w[j], w[j + 1]);
                f = 0;
            }
            else if (w[j]->count == w[j + 1]->count)//频数相同则按字典序排序
            {
                if (strcmp(w[j]->words, w[j + 1]->words) > 0)//比较字符串大小（字典序），大于0说明前者比后者大
                    Swap(w[j], w[j + 1]);
                f = 0;
            }
        }
        if (f == 1)//f==1说明上述排序已经完成，可提前终止
            break;
    }
}
void show(word* w[], int n)
//输出
{
    int i;
    for (i = 0; i < n; i++)
        fprintf(stdout, "%d:%s\n", w[i]->count, w[i]->words);
    printf("打印成功！");
}

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

关于英文单词的最长词频统计 python
2022-06-04 10:00

回答 2 已采纳在你的程序基础上修改如下： import string sent = input() for c in string.punctuation: sent = sent.replace(c,"
Java语言怎么计算一个英文单词在一个txt文件里出现的次数，要忽略大小写的开发语言
2020-06-06 21:05

回答 1 已采纳可以用hashtable实现，每次出现单词，首先看这个表中有没有，有就+1，否则添加进去，最后遍历输出。
统计若干个大型英文txt文件中所有单词出现的次数，并输出出现次数最多的前10个单词及其出现次数
2016-05-30 12:45

回答 1 已采纳 http://www.lxway.com/4084220604.htm
Python 合并多个TXT文件并统计词频的实现
2020-09-18 18:29

在Python编程中，合并多个TXT文件并统计词频是一项常见的文本处理任务，尤其在数据分析、自然语言处理（NLP）等领域。本篇文章将详细介绍如何利用Python实现这一功能，并提供两个不同的实现方法。首先，让我们来看...
MapReduce统计单词出现次数，但是结果显示出多个 hdfs mapreduce
2022-04-21 17:49

回答 2 已采纳发一下你的mr程序可能reduce阶段的代码写错了吧
编程输入一段英文，统计英文中单词出现的次数，并输出结果 python 有问必答
2021-06-16 23:38

回答 3 已采纳 # 统计单词出现次数并把结果输出成字典 # 数据输入 str = "Hello world, There are some test words. Hello world, There are so
c#编程：输入一个英文句子，输入单词时单词间用一个空格隔开，要求统计并输出句子中包含英文单词的个数 c#
2023-04-21 16:11

回答 1 已采纳基于Monster 组和GPT的调写： using System; class Program { static void Main(string[] args) {
英文文本单词词频统计（C++实现）
2021-12-07 20:38

在本项目中，我们主要探讨的是如何使用C++编程语言实现英文文本的单词词频统计。这个任务的核心是处理文本数据，提取其中的单词，并计算它们出现的频率。以下是实现这个功能的一些关键知识点： 1. **C++基础**：C++...
C语言，将英文文本的单词统计，并输出最高频次的十个单词，我建立了链表，但是貌似排序出了问题 c语言
2022-12-19 15:27

回答 6 已采纳 20行之后应该加个head = p2，因为你改变了头结点了
编程实现输入一串英文，统计其中各单词出现的个数 c++ c语言有问必答
2021-06-22 23:11

回答 3 已采纳参考一下：https://blog.csdn.net/abc5382334/article/details/26773539 如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢
输入一段英文以.结尾，每个单词一行输出，统计单词个数，可以多段输出 python
2022-04-22 06:58

回答 1 已采纳 def Filter(line): import re res = re.findall('[^\x20\\.\\,\\?\\!]+',line) return res &g
人工智能-项目实践-信息检索-基于不同策略的英文单词的词频统计和检索系统
2024-03-02 12:00

在本项目实践中，我们聚焦于“人工智能”领域中的一个核心应用——信息检索，具体实现了一个基于不同策略的英文单词词频统计与检索系统。这个系统旨在高效地处理文本数据，通过对英文单词进行词频统计，进而支持快速...
C语言实现英文文本词频统计
2020-08-19 12:33

2. C语言在文本词频统计中的应用：C语言是一种高效的编程语言，广泛应用于文本处理和数据分析领域，特别是在文本词频统计方面具有很高的效率和精度。 3. 单链表在文本词频统计中的应用：单链表是一种常用的数据结构...
python 文本单词提取和词频统计的实例
2020-09-19 19:45

Python是一种广泛用于文本处理的编程语言，特别是在自然语言处理（NLP）和数据挖掘领域。在本实例中，我们将探讨如何使用Python进行文本中的单词提取和词频统计。这两个任务是许多文本分析任务的基础，例如情感分析...
python统计文本字符串里单词出现频率的方法
2020-09-22 00:56

在Python编程中，统计文本字符串中单词出现的频率是一项非常实用的功能，尤其在自然语言处理、文本分析等领域有着广泛的应用。本文将详细介绍如何利用Python来实现这一功能，并深入探讨其中涉及到的字符串操作技巧。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月7日

悬赏问题

¥15 用verilog实现tanh函数和softplus函数
¥15 求京东批量付款能替代天诚
¥15 slaris 系统断电后，重新开机后一直自动重启
¥15 51寻迹小车定点寻迹
¥15 谁能帮我看看这拒稿理由啥意思啊阿啊
¥15 关于vue2中methods使用call修改this指向的问题
¥15 idea自动补全键位冲突
¥15 请教一下写代码，代码好难
¥15 iis10中如何阻止别人网站重定向到我的网站
¥15 滑块验证码移动速度不一致问题

500个英文单词统计词频，但是txt文本只能放大概10个单词才能运行，多了会出现这样的错误

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新