python如何从csv文件中抽出一列并去重后写入一个csv文件中?使用pandas
时间: 2023-10-05 17:14:40 浏览: 111
使用pandas进行csv文件的读写操作非常方便,具体步骤如下:
1. 使用pandas读取原始的csv文件,并读取需要抽取的列,并将其存储到一个Series对象中。
```python
import pandas as pd
df = pd.read_csv('original.csv')
column = df['column_name'].unique() # 假设需要抽取名为'column_name'的列
```
2. 对Series对象进行去重操作。
```python
column = column.drop_duplicates()
```
3. 将去重后的数据写入目标csv文件中。
```python
column.to_csv('result.csv', index=False, header=False)
```
完整代码如下所示:
```python
import pandas as pd
df = pd.read_csv('original.csv')
column = df['column_name'].unique() # 假设需要抽取名为'column_name'的列
column = column.drop_duplicates()
column.to_csv('result.csv', index=False, header=False)
```
需要注意的是,在将Series对象写入csv文件时,应该使用`to_csv`方法,并设置`index=False`和`header=False`参数,这样可以避免写入的数据中出现多余的行和列。
阅读全文