用python语言根据Students_Duplicates.xlsx文件,去除表中重复的数据并显示去除后的内容。
时间: 2024-10-18 19:09:39 浏览: 22
csv_file.rar_csv_csv文件_python_python 读写 excel_python处理csv数据
5星 · 资源好评率100%
在Python中,你可以使用pandas库来处理Excel文件并去除重复数据。首先,你需要安装`openpyxl`和`pandas`两个库,如果你还没有安装,可以使用下面的命令:
```bash
pip install openpyxl pandas
```
然后,你可以按照以下步骤操作:
1. 加载Excel数据到DataFrame中:
```python
import pandas as pd
df = pd.read_excel('Students_Duplicates.xlsx')
```
2. 使用`drop_duplicates()`函数去重:
```python
df_unique = df.drop_duplicates() # 默认会删除所有列的完全相同的行
```
3. 显示去重后的内容:
```python
print(df_unique)
```
如果你想保留特定列的唯一值,可以在`drop_duplicates()`函数中传入参数`subset`,例如,如果你只关心'name'和'email'这两列,可以这样做:
```python
df_unique = df.drop_duplicates(subset=['name', 'email'])
```
阅读全文