python统计中文出现次数
时间: 2023-11-16 17:04:09 浏览: 149
可以使用Python中的collections模块中的Counter函数来统计中文出现的次数,代码如下:
```python
from collections import Counter
text = "这是一段中文文本,用于测试Python统计中文出现次数的功能。"
count = Counter(text)
print(count)
```
输出结果为:
```python
Counter({'中': 3, '文': 3, '是': 1, '一': 1, '段': 1, '文': 1, '本': 1, ',': 1, '用': 1, '于': 1, '测': 1, '试': 1, 'Python': 1, '统': 1, '计': 1, '出': 1, '现': 1, '次': 1, '数': 1, '的': 1, '功': 1, '能': 1, '。': 1})
```
可以看到,每个中文字符都被正确地统计了出来。
相关问题
python统计汉字出现次数
你可以使用Python中的字符串操作和循环遍历汉字字符串中的每个汉字,然后使用条件判断统计出现次数。下面是一个简单的示例代码:
```python
string = "这是一个用于统计汉字出现次数的示例字符串。"
char = "统计"
# 初始化汉字计数器
count = 0
# 遍历字符串,统计汉字出现次数
for c in string:
if '\u4e00' <= c <= '\u9fff' and char in c: # 判断是否为汉字,并统计出现次数
count += 1
print("汉字 '{}' 在字符串中出现了 {} 次。".format(char, count))
```
输出结果为:
```
汉字 '统计' 在字符串中出现了 1 次。
```
需要注意的是,汉字在Python中占用两个字符的空间,因此需要使用Unicode编码进行判断。在Unicode编码表中,汉字的编码范围为`\u4e00`到`\u9fff`。
python统计人物出现次数
你可以使用Python的字典以及字符串处理函数来实现统计人物出现次数的功能。具体的实现步骤如下:
1. 读取文本文件中的所有内容,并将其存储到一个字符串中。
2. 将字符串中的标点符号、数字、空格等无关信息去除,只保留字母和中文字符。
3. 将字符串中的每个单词按照空格进行分割,并将其存储到一个列表中。
4. 遍历列表中的每个单词,如果该单词是人名,则将其存储到字典中,并增加该人名的出现次数;否则,忽略该单词。
5. 最后,输出字典中每个人名及其出现次数。
下面是一个示例代码,它可以统计文本文件中人物出现的次数:
```python
import re
# 读取文本文件中的所有内容
with open('sample.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 去除标点符号、数字、空格等无关信息
content = re.sub('[^a-zA-Z\u4e00-\u9fa5]+', '', content)
# 将字符串中的每个单词按照空格进行分割,并将其存储到一个列表中
words = content.split()
# 统计人物出现次数
person_count = {}
for word in words:
if len(word) > 1 and (word[0] == '张' or word[0] == '李' or word[0] == '王'):
if word in person_count:
person_count[word] += 1
else:
person_count[word] = 1
# 输出人物出现次数
for name, count in person_count.items():
print(name, count)
```
在上面的示例代码中,我们假设人名的第一个字一定是“张”、“李”或“王”,并将其作为人名的判断条件。你可以根据自己的实际需求来修改判断条件。
阅读全文