with open('D:/pycharm/crawler_visual/data/out.csv', 'r', encoding='utf8') as fr: # 读入已经去除停用词的文件 data = jieba.cut(fr.read()) data = dict(Counter(data))
时间: 2024-04-11 14:30:22 浏览: 85
您好!根据您的代码,您正在打开一个名为 'D:/pycharm/crawler_visual/data/out.csv' 的文件,并使用 utf8 编码读取其中的内容。然后,您使用 jieba 库对文件内容进行分词,并将分词结果转换为字典。
最后,您使用 Counter 对分词结果进行计数,生成一个包含词语和对应出现次数的字典。
请问您还有其他问题吗?
相关问题
import json import os #指定原始数据集和目标路径 json_folder_path = "D:/python/pycharm/pycharm_date/Oracle/OracleCS/ce_shi_label" txt_folder_path = "D:/python/pycharm/pycharm_date/Oracle/OracleCS/labels" #获取所有json文件的路径 json_files = [os.path.join(json_folder_path, f) for f in os.listdir(json_folder_path) if f.endswith('.json')] for json_file in json_files:#打开json文件 with open(json_file, 'r', encoding='utf-8') as f:data = json.load(f) image_name = data["img_name"] + ".jpg" label_name = data["img_name"] boxes = data["ann"] #将每个矩形框转换为txt格式 txt_data = "" txt_line_1 = f"{label_name}\n" for box in boxes: x1, y1,x2, y2,class_id = str(box[0]), str(box[1]), str(box[2]),str(box[3]),str(box[4]) txt_line =f"{x1} {y1} {x2} {y2} {class_id}\n" txt_data += txt_line #写入txt文件 txt_file = os.path.join(txt_folder_path, image_name.replace(".jpg", ".txt")) with open(txt_file, 'w', encoding='utf-8') as f:f.write(txt_line_1 + txt_data)将其中json文件的名称统一放在一一个新的txt文件中
可以在循环外部先创建一个空的列表,然后在循环中每次将json文件的名称添加到列表中。循环结束后再将列表中的元素写入到一个新的txt文件中即可。
示例代码如下:
```python
import json
import os
# 指定原始数据集和目标路径
json_folder_path = "D:/python/pycharm/pycharm_date/Oracle/OracleCS/ce_shi_label"
txt_folder_path = "D:/python/pycharm/pycharm_date/Oracle/OracleCS/labels"
# 获取所有json文件的路径
json_files = [os.path.join(json_folder_path, f) for f in os.listdir(json_folder_path) if f.endswith('.json')]
# 创建空的列表
json_names = []
for json_file in json_files:
# 打开json文件
with open(json_file, 'r', encoding='utf-8') as f:
data = json.load(f)
image_name = data["img_name"] + ".jpg"
label_name = data["img_name"]
boxes = data["ann"]
# 将json文件名称添加到列表中
json_names.append(label_name)
# 将每个矩形框转换为txt格式
txt_data = ""
txt_line_1 = f"{label_name}\n"
for box in boxes:
x1, y1,x2, y2,class_id = str(box[0]), str(box[1]), str(box[2]),str(box[3]),str(box[4])
txt_line =f"{x1} {y1} {x2} {y2} {class_id}\n"
txt_data += txt_line
# 写入txt文件
txt_file = os.path.join(txt_folder_path, image_name.replace(".jpg", ".txt"))
with open(txt_file, 'w', encoding='utf-8') as f:
f.write(txt_line_1 + txt_data)
# 将json文件名称写入新的txt文件中
json_names_file = os.path.join(txt_folder_path, "json_names.txt")
with open(json_names_file, 'w', encoding='utf-8') as f:
for name in json_names:
f.write(name + "\n")
```
这样,就可以将所有json文件的名称统一放在一个新的txt文件中了。
FileNotFoundError: No such file: '/tmp/pycharm_project_741/pycharm_project_809/BoostingMonocularDepth/outputs/moon.png'
`FileNotFoundError`通常表示Python无法找到指定的文件路径。这里有两个情况:
1. 在第一个引用[^1]中,错误提示`No such file or directory`表明尝试打开的文件`./C/d.txt`不存在于指定的目录`./C`下。解决这个问题,你需要确认文件的确存在并且路径正确。如果文件位于其他位置,你应该更新`d.txt`的绝对或相对路径。
2. 在第二个引用[^2]中,PyCharm在远程环境中遇到同样的`FileNotFoundError`,可能是因为它试图切换到`/home/tmp`目录,但该目录不存在。确保`/home/tmp`是你期望的工作目录,并且这个目录对PyCharm有正确的权限访问。你可以尝试更改命令行的当前工作目录(`cd`)为项目实际所在的目录,如`cd pycharm_project_809`。
如果你正在运行的是一个脚本并尝试读取`moon.png`,请检查文件路径是否正确,并确保`moon.png`确实存在于`outputs`子目录中。如果文件不在预期的位置,你可能需要调整你的代码来指向正确的文件路径,例如:
```python
# 假设`moon.png`应该在当前工作目录的子目录'BoostingMonocularDepth/outputs'
try:
with open('outputs/moon.png', 'r') as f:
# ... 你的操作 ...
except FileNotFoundError:
print(f"File not found: {os.getcwd()}/outputs/moon.png")
```
阅读全文