python 选取原有df中两列成立新的df
时间: 2024-08-13 20:09:15 浏览: 46
在Python的pandas库中,如果你想要从一个DataFrame(df)中选择两列数据并创建一个新的DataFrame,你可以按照以下步骤操作:
1. 首先,导入pandas库:
```python
import pandas as pd
```
2. 假设你有一个名为`df`的DataFrame,它有两列你需要提取:`column_name_1`和`column_name_2`。将这些列名替换为实际的列名:
```python
selected_columns = df[['column_name_1', 'column_name_2']]
```
这里使用方括号`[]`语法指定列名列表。
3. 如果新创建的数据框不需要原始DataFrame的其他列,可以直接赋值给一个新的变量:
```python
new_df = selected_columns
```
如果你想保留原始索引或其他信息,可以在创建新DataFrame时传递相应的参数。例如,如果想保留索引:
```python
new_df = selected_columns.set_index(df.index)
```
现在,`new_df`就是由`column_name_1`和`column_name_2`这两列组成的新的DataFrame。如果你有关于这个过程的具体问题,如如何处理缺失值、数据类型转换等,请随时提问:
相关问题
python获取excel中某两列的数据
可以使用Python的pandas库来获取Excel中的数据。这里提供一个简单的示例代码:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('example.xlsx')
# 获取指定两列的数据
data = df[['Column1', 'Column2']]
```
其中`example.xlsx`是Excel文件名,`Column1`和`Column2`是你需要获取数据的两列名字,可以根据具体情况修改。`data`变量里存储的就是这两列的数据。
选取dataframe中两列生成新的dataframe,索引与原dataframe相同
可以使用pandas的切片操作来选取dataframe中的两列,并生成一个新的dataframe。假设原dataframe的名称是df,我们要选取的两列分别是column1和column2,可以使用以下代码来实现:
```python
new_df = df[['column1', 'column2']]
```
这样就会生成一个新的dataframe new_df,其中包含了原dataframe中的column1和column2两列数据,并且索引与原dataframe相同。
阅读全文