python语言实现tag统计。读取txt文件中的文本,统计规则是以空格分割一行字符串,若遇到W/I/V/D/E,则下一位为TAG,判断是否为TAG,满足以":"结尾,则去掉":",计数加一,再读取下一行
时间: 2024-05-07 08:17:47 浏览: 60
好的,我可以为您提供Python代码来实现这个功能。
首先,您需要打开txt文件并逐行读取文件。您可以使用以下代码:
```
with open('file.txt', 'r') as f:
lines = f.readlines()
```
接下来,您需要遍历每一行并检查该行中是否包含W/I/V/D/E。如果有,就检查下一个单词是否以":"结尾。如果是,则将其作为TAG计数,并将计数器加一。以下是示例代码:
```
tag_count = 0 # 初始化TAG计数器
for line in lines:
words = line.strip().split()
for i in range(len(words)):
if words[i] in ['W', 'I', 'V', 'D', 'E']:
if i+1 < len(words) and words[i+1].endswith(':'):
tag_count += 1
```
最后,您可以打印出TAG的数量:
```
print("TAG count:", tag_count)
```
完整代码如下:
```
with open('file.txt', 'r') as f:
lines = f.readlines()
tag_count = 0 # 初始化TAG计数器
for line in lines:
words = line.strip().split()
for i in range(len(words)):
if words[i] in ['W', 'I', 'V', 'D', 'E']:
if i+1 < len(words) and words[i+1].endswith(':'):
tag_count += 1
print("TAG count:", tag_count)
```
阅读全文