使用python三方库pandas读取csv文件,不统计重复数据
时间: 2023-05-16 20:06:56 浏览: 64
可以使用pandas库中的drop_duplicates()函数来去除重复数据,示例代码如下:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
# 去除重复数据
df = df.drop_duplicates()
# 输出结果
print(df)
```
其中,'data.csv'是你要读取的csv文件名,drop_duplicates()函数会返回一个去除重复数据后的新DataFrame对象。
相关问题
使用python三方库pandas读取csv文件的表头数据,无需统计重复数据
可以使用以下代码读取csv文件的表头数据:
```python
import pandas as pd
df = pd.read_csv('file.csv', nrows=0)
header = df.columns.tolist()
print(header)
```
其中,`nrows=0`表示只读取文件的第一行,即表头数据。`df.columns.tolist()`将表头数据转换为列表格式并输出。
使用python三方库pandas读取csv文件的表头数据
可以使用pandas库中的read_csv函数来读取csv文件的表头数据。具体代码如下:
import pandas as pd
# 读取csv文件
df = pd.read_csv('file.csv')
# 获取表头数据
headers = df.columns.tolist()
print(headers)
注意,需要将'file.csv'替换为你实际的csv文件路径。