首页编程统计文本中的单词数量，不包括空格和除单引号以外的标点符号（!"#$%&()*+,./:;<=>?@[]^_{|}~\n），这些符号和空白符一样都是单词的分隔符，数字及多个连续的数字按一个单词计算，类似I'll和wife's等单词当成一个词计。

编程统计文本中的单词数量，不包括空格和除单引号以外的标点符号（!"#$%&()*+,./:;<=>?@[]^_{|}~\n），这些符号和空白符一样都是单词的分隔符，数字及多个连续的数字按一个单词计算，类似I'll和wife's等单词当成一个词计。

时间: 2023-11-27 18:53:06 浏览: 292

编写一个程序，用于统计文件中单词的总数，不同单词的数目。（假设输入文件中只包含字母和空格）

5星 · 资源好评率100%

练习题（要求使用伪代码给出算法）：编写一个程序，用于统计文件中单词的总数，不同单词的数目。（假设输入文件中只包含字母和空格） eg: I love Beijing and I love Shanghai 单词总数：7 不同单词数目：5

首先，我们需要读入文本文件并将其内容存储到一个字符串变量中。然后，我们可以使用正则表达式来匹配单词并计数它们的数量。以下是一个Python程序示例： ```python import re with open('text.txt', 'r') as file: text = file.read() # 将文本中除字母、单引号和数字以外的字符替换为空格 text = re.sub(r"[^a-zA-Z0-9']", ' ', text) # 将多个连续的空格替换为一个空格 text = re.sub(r"\s+", ' ', text) # 统计单词数量 word_count = len(re.findall(r"\b\w+\b", text)) print("单词数量: ", word_count) ``` 这个程序首先读取一个名为 `text.txt` 的文本文件，并将其内容存储到一个字符串变量中。接着，使用正则表达式将文本中除字母、单引号和数字以外的字符替换为空格，并将多个连续的空格替换为一个空格。最后，使用正则表达式 `\b\w+\b` 匹配所有单词，并使用 `len()` 函数计算单词数量。

阅读全文

最新推荐

编程统计文本中的单词数量，不包括空格和除单引号以外的标点符号（!"#$%&()*+,./:;<=>?@[]^_{|}~\n），这些符号和空白符一样都是单词的分隔符，数字及多个连续的数字按一个单词计算，类似I'll和wife's等单词当成一个词计。

相关推荐

【python123题库附件】统计文本中单词数

常用标点符号的英文读音列表.txt

统计一个文本文件中字数，每个字母按一个汉字计算，不包括所有标点符号和空格。 !"#$%&()*+,-./:;<=>?@^_‘{|}~\n！？，。：；、｛｝【】“”％￥＃＠……＆×（）——＋‪‪‪‪‪‪‪‪‪‪‪‫‪ testmayun.docx

不能包含特殊字符:;!@#$%^&**()且可为中英文长度限制为2~32个字符的正则表达式

用户姓名允许重复，可为中英文，长度限制为2~32个 字符，不能包含特殊字符：;!@#$%^&**()的正则表达式

for ch in '''!"$%&()*+,-./;:<=>?@[\\]^_{|}~''\n\t ''':

使用c语言输出如下图案：* ## %%% **** ##### %%%%%%

/^.*(?=.{8,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@\.#$%^&*? ]).*$/解释该正则表达式

python+统计文本中的每个中文词、英文词、数字、标点符号、空格和其他符号出现的

创建一个包含一段中文的文本文件，统计文件中中文字数，不包括标点符号和空格。

4. 创建一个包含一段中文的文本文件，统计文件中中文字数，不包括标点符号和空格。

最新推荐

javascript去除字符串中所有标点符号和提取纯文本的正则

Java判断中英文符号、标点的实现

Python实现统计文本文件字数的方法

python 文本单词提取和词频统计的实例

基于 C++构建 Qt 实现的 GDAL 与 PROJ4 的遥感图像处理软件课程设计

C语言数组操作：高度检查器编程实践

管理建模和仿真的文件

【KUKA系统变量进阶】：揭秘从理论到实践的5大关键技巧

如何使用Python编程语言创建一个具有动态爱心图案作为背景并添加文字'天天开心（高级版）'的图形界面？

基于Swift开发的嘉定单车LBS iOS应用项目解析

用户姓名允许重复，可为中英文，长度限制为2~32个字符，不能包含特殊字符：;!@#$%^&**()的正则表达式

/^.(?=.{8,})(?=.\d)(?=.[A-Z])(?=.[a-z])(?=.[!@\.#$%^&? ]).*$/解释该正则表达式