import os import docx text=[] man=0 wom=0 jy=0 wm=0 hz=0 sz=0 path="E:\\keshihua\\data\\sec\\docx\\docx" filelist=os.listdir(path) for image_id in filelist: position=path+"\\"+image_id f=docx.Document(position) for para in f.paragraphs: text.extend(para.text.split(',')) for i in text: if i[-1]=="族": hz=hz+1 break if i[0]族": sz=sz+1 break 哪里错了
时间: 2024-03-08 19:50:41 浏览: 70
云计算=SaaS+网格计算+虚拟化.docx
代码中存在一些问题:
1. 第一行应该每个导入语句单独一行,如下所示:
```
import os
import docx
```
2. 在第3行,可以将 `text=[]` 和 `man=0, wom=0, jy=0, wm=0, hz=0, sz=0` 分别放在不同的行上,以提高代码的可读性。
3. 在第6行,应该使用 `os.path.join()` 函数来拼接路径,避免因为不同操作系统的路径分隔符不同而出现问题。
4. 在第9行,应该在循环外部初始化 `text` 列表,避免重复添加元素。
5. 在第11行,应该将 `text` 列表中的所有元素都转化为小写字母,以便于后面的字符串比较操作。
6. 在第14行和第18行,应该将 `if` 和 `break` 放在同一行上,以避免因为缩进问题导致程序逻辑错误。
7. 在第16行和第20行,判断字符串是否以 "族" 结尾或者以 "族" 开头时,应该使用 `i.endswith("族")` 和 `i.startswith("族")` 函数,避免因为字符串长度不同而出现问题。
综上所述,可以参考下面的代码:
```
import os
import docx
text = []
man, wom, jy, wm, hz, sz = 0, 0, 0, 0, 0, 0
path = "E:/keshihua/data/sec/docx/docx"
filelist = os.listdir(path)
for image_id in filelist:
position = os.path.join(path, image_id)
f = docx.Document(position)
for para in f.paragraphs:
text.extend(para.text.lower().split(","))
for i in text:
if i.endswith("族"):
hz += 1
break
elif i.startswith("族"):
sz += 1
break
```
希望对你有所帮助!
阅读全文