python如何计算字符串s的中文字符个数和中文词语个数
时间: 2024-01-21 13:19:36 浏览: 184
用c语言实现 计算一个字符串中单词的个数
5星 · 资源好评率100%
Python中可以使用中文分词工具jieba来计算中文词语个数,也可以使用正则表达式来计算中文字符个数。
计算中文字符个数的方法如下:
```python
import re
def count_chinese_chars(s):
pattern = re.compile(r'[\u4e00-\u9fa5]') # 匹配所有中文字符
return len(pattern.findall(s))
```
其中,正则表达式`[\u4e00-\u9fa5]`匹配所有中文字符,使用`findall()`方法统计匹配到的中文字符个数。
计算中文词语个数的方法如下:
```python
import jieba
def count_chinese_words(s):
words = jieba.cut(s) # 对字符串进行中文分词
count = 0
for word in words:
if len(word) > 1: # 只考虑长度大于1的词语
count += 1
return count
```
其中,使用`jieba.cut()`方法对字符串进行中文分词,得到分词结果后,遍历每个词语并统计长度大于1的词语个数。需要注意的是,使用jieba分词需要先安装jieba库。
阅读全文