首页写一段代码，要求：1.读取/Users/rachel_lrq/Desktop/浙江分词.csv 2.去除停用词/Users/rachel_lrq/Desktop/实习/哈工大停用词表.txt 3.将结果保存在一个新的csv文件中

写一段代码，要求：1.读取/Users/rachel_lrq/Desktop/浙江分词.csv 2.去除停用词/Users/rachel_lrq/Desktop/实习/哈工大停用词表.txt 3.将结果保存在一个新的csv文件中

时间: 2023-08-12 08:05:50 浏览: 102

你可以使用Python的pandas和jieba库来完成这个任务。首先，你需要安装这两个库，可以使用以下命令： ``` pip install pandas jieba ``` 接下来，你可以使用以下代码来实现你的需求： ```python import pandas as pd import jieba # 读取CSV文件 df = pd.read_csv('/Users/rachel_lrq/Desktop/浙江分词.csv') # 读取停用词表 stopwords = set() with open('/Users/rachel_lrq/Desktop/实习/哈工大停用词表.txt', 'r', encoding='utf-8') as f: for line in f: stopwords.add(line.strip()) # 定义分词函数 def segment(sentence): words = jieba.cut(sentence) words = [word for word in words if word not in stopwords] return ' '.join(words) # 对文本进行分词处理 df['分词结果'] = df['文本内容'].apply(segment) # 保存结果到新的CSV文件 df.to_csv('/Users/rachel_lrq/Desktop/分词结果.csv', index=False) ``` 这段代码会读取指定路径下的CSV文件，然后使用jieba库进行分词，并去除停用词。最后，将处理后的结果保存到一个新的CSV文件中。请确保替换代码中的文件路径为你自己的实际路径。

阅读全文