使用pandas按照月份列和经销商名称行和item行,提取指定的数据
时间: 2024-02-23 21:00:06 浏览: 60
假设你有一个名为“df”的Pandas DataFrame,其中包含“Month”、“Dealer Name”和“Item”列,以及其他列,你想要按照这些列的值提取指定的数据。你可以使用 Pandas 的 loc 方法和布尔索引来实现此功能。以下是示例代码:
```python
import pandas as pd
# 读取数据到 DataFrame
df = pd.read_csv('data.csv')
# 设置 Month、Dealer Name 和 Item 列为索引
df = df.set_index(['Month', 'Dealer Name', 'Item'])
# 提取指定数据
selected_data = df.loc[(['2022-01', '2022-02'], 'Dealer A', 'Item B'), :]
# 显示结果
print(selected_data)
```
在上述代码中,首先使用 set_index 方法将 Month、Dealer Name 和 Item 列设置为索引。然后使用 loc 方法和布尔索引提取指定数据,其中包括 Month 列为“2022-01”或“2022-02”、Dealer Name 列为“Dealer A”、Item 列为“Item B”的数据。最后使用 print 函数显示结果。
需要注意的是,如果 Month、Dealer Name 和 Item 列没有进行排序,则在使用 loc 方法和布尔索引时需要按照层级顺序进行排序。例如,可以使用 sort_index 方法按照 Month、Dealer Name 和 Item 列的顺序进行排序:
```python
df = df.sort_index(level=['Month', 'Dealer Name', 'Item'])
```
这样可以确保在使用 loc 方法和布尔索引时按照正确的顺序进行筛选。
阅读全文