with open('filtered_dataset1.csv', 'r', encoding='utf-8') as csvfile: reader = csv.reader(csvfile) for row in reader: col1_words = jieba.lcut(row[1]) # 输出分词结果 print(col1_words) 怎么保存成csv
时间: 2024-02-05 07:03:36 浏览: 25
在你的代码中,每次对一行文本进行分词后,可以将分词结果保存到一个列表中,然后将这个列表加入到一个新的二维列表中,最后使用csv库将二维列表写入csv文件。
以下是示例代码:
```python
import csv
import jieba
# 读取原始csv文件
with open('filtered_dataset1.csv', 'r', encoding='utf-8') as csvfile:
reader = csv.reader(csvfile)
# 创建空列表,用于保存分词结果
word_list = []
for row in reader:
# 对每一行文本进行分词
col1_words = jieba.lcut(row[1])
# 将分词结果加入到列表中
word_list.append(col1_words)
# 将二维列表写入新的csv文件
with open('filtered_dataset1_wordseg.csv', 'w', encoding='utf-8', newline='') as csvfile:
writer = csv.writer(csvfile)
writer.writerows(word_list)
```
运行以上代码后,当前目录下会生成一个名为'filtered_dataset1_wordseg.csv'的文件,其中包含分词后的文本。
相关问题
FileNotFoundError: [Errno 2] No such file or directory: 'filtered_train.csv'
FileNotFoundError是Python中的一个异常类型,表示文件或目录不存在的错误。具体来说,[Errno 2] No such file or directory: 'filtered_train.csv'这个错误提示说明在当前路径下找不到名为filtered_train.csv的文件。
可能的原因有:
1. 文件名或路径错误:请确保文件名和路径的拼写是正确的,并且文件确实存在于指定的路径中。
2. 文件不存在:如果文件确实不存在,您需要检查文件是否被删除或移动到其他位置。
3. 工作目录错误:如果您在代码中使用了相对路径,那么文件的查找路径是相对于当前工作目录的。请确保您的代码执行时所在的工作目录是正确的。
4. 权限问题:如果您没有足够的权限来访问该文件或目录,也会导致该错误。请确保您具有读取该文件或目录的权限。
import jieba import numpy import numpy as np from PIL import Image from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt with open("comments.txt","r",encoding="utf-8") as f: comments = f.read() words = jieba.cut(comments) stopwords = set(STOPWORDS) stopwords.add('腾讯') stopwords.add('游戏') filtered_words = [] for word in words: if word not in stopwords: filtered_words.append(word) mask = np.array(Image.open("mask.png")) cloud = WordCloud( font_path="C:\Windows\Fonts\simsun.ttc", background_color="white", mask=mask ).generate(" ".join(filtered_words)) cloud.to_file("词云.png") print("词云绘制成功")这个代码怎么运行错误
这段代码的错误可能是缩进不正确。正确的代码应该是这样的:
```
import jieba
import numpy
import numpy as np
from PIL import Image
from wordcloud import WordCloud, STOPWORDS
import matplotlib.pyplot as plt
with open("comments.txt","r",encoding="utf-8") as f:
comments = f.read()
words = jieba.cut(comments)
stopwords = set(STOPWORDS)
stopwords.add('腾讯')
stopwords.add('游戏')
filtered_words = []
for word in words:
if word not in stopwords:
filtered_words.append(word)
mask = np.array(Image.open("mask.png"))
cloud = WordCloud(
font_path="C:\Windows\Fonts\simsun.ttc",
background_color="white",
mask=mask
).generate(" ".join(filtered_words))
cloud.to_file("词云.png")
print("词云绘制成功")
```
请检查一下你的代码是否与这段代码一致。