选取dataframe中两列生成新的dataframe,索引与原dataframe相同
时间: 2023-11-18 10:51:25 浏览: 142
可以使用pandas的切片操作来选取dataframe中的两列,并生成一个新的dataframe。假设原dataframe的名称是df,我们要选取的两列分别是column1和column2,可以使用以下代码来实现:
```python
new_df = df[['column1', 'column2']]
```
这样就会生成一个新的dataframe new_df,其中包含了原dataframe中的column1和column2两列数据,并且索引与原dataframe相同。
相关问题
DataFrame选取两列数据
可以使用 Pandas 的 loc 或 iloc 方法来选取 DataFrame 中的两列数据。
假设有一个 DataFrame 叫做 df,其中包含了三列数据,分别为 A、B、C,选取 A 和 B 两列数据的代码如下:
使用 loc 方法:
```
df.loc[:, ['A', 'B']]
```
使用 iloc 方法:
```
df.iloc[:, [0, 1]]
```
其中 loc 方法中的冒号表示选取所有行,中括号中的列表表示选取列名为 A 和 B 的两列数据。
而 iloc 方法中的冒号和列表分别代表选取所有行和选取第 1 和第 2 列数据(因为 Python 中的索引是从 0 开始的)。
选取完两列数据后,可以将结果赋值给新的 DataFrame 或者直接对选取结果进行其他的操作。
dataframe选取某两列
可以使用`loc`或`iloc`方法选取某两列。这里给出两种方法的示例:
1. 使用`loc`方法选取某两列,例如选取`name`和`age`两列:
```python
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Tokyo']})
# 选取name和age两列
df_subset = df.loc[:, ['name', 'age']]
print(df_subset)
```
输出结果如下:
```
name age
0 Alice 25
1 Bob 32
2 Charlie 18
3 David 47
```
2. 使用`iloc`方法选取某两列,例如选取第一列和第二列:
```python
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 32, 18, 47],
'city': ['New York', 'Paris', 'London', 'Tokyo']})
# 选取第一列和第二列
df_subset = df.iloc[:, [0, 1]]
print(df_subset)
```
输出结果如下:
```
name age
0 Alice 25
1 Bob 32
2 Charlie 18
3 David 47
```
需要注意的是,使用`loc`方法选取列时,需要使用列名;而使用`iloc`方法选取列时,需要使用列的索引。
阅读全文