linux下c语言编程,打开文件并读取,统计所有单词数并做一个词云
时间: 2024-01-21 18:03:02 浏览: 127
好的,这是一个很常见的任务,我可以给你一个简单的思路:
1. 打开文件并读取内容:使用标准C库函数fopen()打开文件,使用fscanf()函数逐个读取单词,将单词存储在一个数组或链表中。
2. 统计单词数:遍历存储单词的数组或链表,统计每个单词出现的次数。
3. 生成词云:将单词及其出现的次数作为输入,使用第三方库(例如WordCloud)生成词云。
下面是一个简单的示例代码,仅供参考:
```c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>
#include <stdbool.h>
#define MAX_WORD_LEN 100
#define MAX_WORDS 100000
typedef struct {
char word[MAX_WORD_LEN];
int count;
} WordNode;
WordNode words[MAX_WORDS];
int wordCount = 0;
void addWord(char *word) {
for (int i = 0; i < wordCount; i++) {
if (strcmp(words[i].word, word) == 0) {
words[i].count++;
return;
}
}
strcpy(words[wordCount].word, word);
words[wordCount].count = 1;
wordCount++;
}
bool isWordChar(char c) {
return isalpha(c) || isdigit(c) || c == '_';
}
void parseFile(char *filename) {
FILE *fp = fopen(filename, "r");
if (fp == NULL) {
fprintf(stderr, "Failed to open file %s\n", filename);
exit(1);
}
char word[MAX_WORD_LEN];
while (fscanf(fp, "%s", word) != EOF) {
int len = strlen(word);
int i = 0;
while (i < len && !isWordChar(word[i])) {
i++;
}
int j = i;
while (j < len && isWordChar(word[j])) {
j++;
}
if (i < j) {
word[j] = '\0';
addWord(word+i);
}
}
fclose(fp);
}
int compareWordCount(const void *a, const void *b) {
return (*(WordNode*)b).count - (*(WordNode*)a).count;
}
void generateWordCloud() {
for (int i = 0; i < wordCount; i++) {
printf("%s: %d\n", words[i].word, words[i].count);
}
}
int main(int argc, char *argv[]) {
if (argc < 2) {
fprintf(stderr, "Usage: %s <filename>\n", argv[0]);
exit(1);
}
parseFile(argv[1]);
qsort(words, wordCount, sizeof(WordNode), compareWordCount);
generateWordCloud();
return 0;
}
```
这个代码会读取一个文件,并统计其中所有单词出现的次数,最后输出每个单词及其出现的次数。你可以将它与第三方词云库结合使用,生成一个漂亮的词云。
阅读全文