pandas删除行相同内容
时间: 2023-07-12 10:35:58 浏览: 80
如果要删除 DataFrame 中所有行的相同内容,可以使用 `drop_duplicates()` 方法。下面是一个示例代码:
```python
import pandas as pd
# 创建一个 DataFrame
df = pd.DataFrame({'A': [1, 1, 2, 3, 4], 'B': [1, 2, 2, 3, 4], 'C': [1, 2, 3, 3, 4]})
# 删除所有行的相同内容
df = df.drop_duplicates()
print(df)
```
输出如下:
```
A B C
0 1 1 1
1 1 2 2
2 2 2 3
3 3 3 3
4 4 4 4
```
在上面的示例代码中,我们首先创建了一个 DataFrame,然后使用 `drop_duplicates()` 方法删除了所有行的相同内容,最后输出了结果。
相关问题
python pandas合并相同行
你可以使用 pandas 库中的 `groupby` 和 `agg` 函数来合并相同行。下面是一个简单的示例:
假设你有以下数据集:
```
import pandas as pd
df = pd.DataFrame({
'Name': ['John', 'John', 'Alice', 'Alice', 'Bob', 'Bob'],
'Age': [30, 30, 25, 25, 35, 35],
'Salary': [5000, 6000, 7000, 8000, 9000, 10000]
})
print(df)
```
输出:
```
Name Age Salary
0 John 30 5000
1 John 30 6000
2 Alice 25 7000
3 Alice 25 8000
4 Bob 35 9000
5 Bob 35 10000
```
如果你想按照 `Name` 和 `Age` 合并相同行,并将 `Salary` 求和,可以使用如下代码:
```
df = df.groupby(['Name', 'Age']).agg({'Salary': sum}).reset_index()
print(df)
```
输出:
```
Name Age Salary
0 Alice 25 15000
1 Bob 35 19000
2 John 30 11000
```
如上所示,相同的行已被合并,重复的 `Name` 和 `Age` 被删除,`Salary` 也被求和。
pandas删除重复行
要删除 pandas DataFrame 中的重复行,可以使用 `drop_duplicates()` 方法。该方法默认会比较所有列,如果有一行与另一行完全相同,则被视为重复行。
以下是一个示例代码:
``` python
import pandas as pd
# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice'],
'age': [25, 30, 35, 25],
'gender': ['F', 'M', 'M', 'F']}
df = pd.DataFrame(data)
# 删除重复行
df = df.drop_duplicates()
# 打印结果
print(df)
```
输出结果如下:
```
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
```
在上面的示例中,我们首先创建一个包含重复行的 DataFrame,然后使用 `drop_duplicates()` 方法删除了这些重复行。最后,打印了结果以验证删除操作是否正确。
阅读全文