将键盘输入的文字保存到c:\myFile.txt中,打开该文件,统计单词出现的次数,选择re.split('.| |,|\n',a))分割字符串,对于数字可选择函数判断是不是数字或采用if语句判断并过滤,如果碰到单词的变化形式则按照原形进行统计。建立4级单词集合,统计4级单词出现的次数,输入为键盘输入文本,输出为输出单词出现的次数与4级单词集合(均为单词原形,且按照单词在原文中的顺序输出)
时间: 2024-04-17 14:24:44 浏览: 80
这是一个使用Python实现的例代码,将键输入的文字保存到文件,并统计单词现的次数和级单词集合:
python
import re
collections import Counter
def is(word):
try:
float(word)
return
except ValueError:
return
def save_text_to(file_path):
text =("请输入文本:")
with open(file_path, "w") as file:
file(text)
def count_words_path):
word_list = with open(file_path "r") as file:
for line in file:
words = re.split(r'[.,\n\s]', line)
for word words:
if not is_number(word) and word != '':
word_list.append(word.lower())
word_count = Counter(word_list)
return word_count
def filter_four_level_words(word_count):
four_level_words = set()
for word in word_count.keys():
if len(word) == 4:
four_level_words.add(word)
return four_level_words
file_path = "c:/myFile.txt"
save_text_to_file(file_path)
word_count = count_words(file_path)
four_level_words = filter_four_level_words(word_count)
print("单词出现次数:")
for word, count in word_count.items():
print(f"{word}: {count}")
print("四级单词集合:")
for word in four_level_words:
print(word)
```
这段代码会提示你输入文本,并将文本保存到指定的文件路径`c:/myFile.txt`中。然后,它会统计该文本中单词的出现次数,并输出每个单词的出现次数。接下来,它会过滤出四级单词(长度为4的单词),并输出四级单词集合。
请注意,代码中的`is_number`函数用于判断一个字符串是否为数字。它使用了`try-except`语句来检测字符串是否可以转换为浮点数,从而判断是否为数字。如果是数字,则返回`True`;否则,返回`False`。你可以根据需要自定义判断数字的逻辑。
另外,代码使用了正则表达式`re.split(r'[.,\n\s]', line)`来分割字符串。它会将字符串按照句号、逗号、换行符和空格进行分割,得到单词列表。这样可以确保较为准确地分割出单词。
阅读全文