我有两个csv文件,这两个csv文件的第二列是时间,第三列是评分,第四列是评论内容,现在筛选时间在2020年之后的第二、第三、第四列内容,然后将这两个csv文件筛选出来的内容合并到一个csv文件中
时间: 2024-03-13 07:45:05 浏览: 44
csv-merger:将保存csv文件的许多相同类型的数据合并到一个csv文件中。 所有输入的csv文件应具有相同的列数,否则将出现异常
好的,您可以使用Python中的pandas库来完成这个任务。
首先,您需要安装pandas库,可以使用以下命令:
```
pip install pandas
```
然后,您可以使用以下代码来实现您的需求:
```python
import pandas as pd
# 读取第一个csv文件
df1 = pd.read_csv('file1.csv')
# 读取第二个csv文件
df2 = pd.read_csv('file2.csv')
# 将第二列转换为日期类型
df1['time'] = pd.to_datetime(df1['time'])
df2['time'] = pd.to_datetime(df2['time'])
# 筛选出时间在2020年之后的记录
df1 = df1[df1['time'].dt.year >= 2020]
df2 = df2[df2['time'].dt.year >= 2020]
# 筛选第二、第三、第四列
df1 = df1.iloc[:, 1:4]
df2 = df2.iloc[:, 1:4]
# 合并两个DataFrame
result = pd.concat([df1, df2])
# 将结果保存到csv文件中
result.to_csv('result.csv', index=False)
```
以上代码假设第一个csv文件名为`file1.csv`,第二个csv文件名为`file2.csv`,结果保存在`result.csv`文件中。您可以根据实际情况进行修改。
阅读全文