首页将某一列设为索引列再取出该列中值相同的几行

将某一列设为索引列再取出该列中值相同的几行

时间: 2023-12-07 21:05:04 浏览: 90

可以使用 Pandas 的 `set_index()` 函数将某一列设为索引列，然后使用 `duplicated()` 和 `drop_duplicates()` 函数来选取该列中值相同的几行。假设你的 DataFrame 如下所示： ``` import pandas as pd df = pd.DataFrame({ 'id': [1, 2, 3, 3, 4, 4, 5], 'value': [10, 20, 30, 30, 40, 40, 50] }) ``` 如果你想选取 `value` 列中值为 30 和 40 的行，可以先将 `value` 列设为索引列，然后使用 `duplicated()` 和 `drop_duplicates()` 函数来选取相应的行，如下所示： ``` df = df.set_index('value') df = df.loc[df.index.duplicated(keep=False) & df.index.isin([30, 40])] df = df.reset_index().drop_duplicates(subset='index', keep='first').set_index('index') ``` 第一行代码中，`df.set_index('value')` 将 `value` 列设为索引列。第二行代码中，`df.index.duplicated(keep=False)` 会返回所有重复的索引行，`df.index.isin([30, 40])` 会返回 `value` 列中值为 30 和 40 的行。使用 `&` 运算符将两个条件合并，选出 `value` 列中值为 30 和 40 并且索引列中重复的行。第三行代码中，`df.reset_index()` 将索引列转换为普通列，`df.drop_duplicates(subset='index', keep='first')` 根据 `index` 列去重，保留第一个出现的行，然后再使用 `df.set_index('index')` 将 `index` 列设为索引列，得到最终结果。

阅读全文