怎么将一个DataFrame只取其中的几列作为一个新的DataFrame
时间: 2023-07-25 16:37:57 浏览: 127
你可以使用 pandas 的 loc 或 iloc 方法来选取 DataFrame 中的列,以创建一个新的 DataFrame。
- loc 方法:使用列名来选取列。例如,选取名为 col1 和 col2 的列:
```python
new_df = df.loc[:, ['col1', 'col2']]
```
- iloc 方法:使用列的索引来选取列。例如,选取索引为 0 和 1 的列:
```python
new_df = df.iloc[:, [0, 1]]
```
这两种方法都会返回一个新的 DataFrame,其中包含原始 DataFrame 中指定的列。注意,使用这些方法时需要注意 DataFrame 的索引和列名的对应关系。
相关问题
dataframe取特定几列
### 回答1:
可以使用 Pandas 库来取特定几列的数据。假设我们的数据框为 df,我们可以使用以下代码来选择需要的列:
``` python
# 选择第一列和第三列
new_df = df.iloc[:, [0, 2]]
```
其中 `iloc` 表示根据行索引和列索引来选择数据,`[:, [0, 2]]` 表示选择所有行和第一列和第三列。如果要选择列名为特定名称的列,则可以使用以下代码:
``` python
# 选择 '列名1' 和 '列名2' 列
new_df = df[['列名1', '列名2']]
```
其中 `['列名1', '列名2']` 表示选择列名为 '列名1' 和 '列名2' 的列。
### 回答2:
要从DataFrame中获取特定的几列数据,可以使用以下方法:
1. 通过列名来选择列:
```python
df_new = df[['列名1', '列名2', '列名3']]
```
其中,`df`是原始的DataFrame,`df_new`是包含所选列的新DataFrame。可以将所需的列名作为列表传递给`[]`操作符。
2. 通过列索引来选择列:
```python
df_new = df.iloc[:, [索引1, 索引2, 索引3]]
```
其中,`df`是原始的DataFrame,`df_new`是包含所选列的新DataFrame。使用`iloc`方法,通过逗号分隔的方式指定所需的行和列的索引。
3. 通过布尔条件来选择列:
```python
df_new = df.loc[:, df.columns.isin(['列名1', '列名2', '列名3'])]
```
其中,`df`是原始的DataFrame,`df_new`是包含所选列的新DataFrame。使用`loc`方法和`columns.isin()`方法,传递一个布尔条件来选择所需的列。
以上方法可以根据具体需求选择其中一种或多种方式来获取特定几列的数据。
### 回答3:
要从DataFrame中取特定几列,可以使用两种方法。
第一种方法是使用列名切片。在DataFrame中,我们可以通过指定列名来访问特定列。例如,假设我们有一个DataFrame df,其中包含列A、列B和列C,我们想要访问列A和列B。我们可以使用以下代码来实现:
```python
selected_columns = df[['A', 'B']]
```
这将返回一个新的DataFrame,其中只包含选择的列A和列B。
第二种方法是使用iloc函数。iloc函数允许我们通过列的整数位置来选择特定列。例如,假设我们想要获取第一列和第三列。我们可以使用以下代码来实现:
```python
selected_columns = df.iloc[:, [0, 2]]
```
在这个例子中,我们使用了冒号来选择所有的行,然后通过列表[0, 2]选择了第一列和第三列。这也将返回一个新的DataFrame,其中只包含选择的列。
无论使用哪种方法,我们都可以根据需要选择DataFrame中的特定列。
阅读全文