10. 将所提取的特征存储到新的dataFrame中
时间: 2024-03-13 17:42:43 浏览: 5
好的,您可以使用 Pandas 库将所提取的特征存储到新的 DataFrame 中。以下是一个示例代码:
```python
import pandas as pd
# 创建示例数据
data = {'id': [1, 2, 3, 4, 5],
'name': ['Tom', 'Jerry', 'Lucy', 'Lily', 'Mike'],
'age': [22, 25, 35, 28, 30],
'income': [5000, 6000, 8000, 7000, 9000],
'score': [90, 85, 80, 95, 88]}
df = pd.DataFrame(data)
# 提取 age、income、score 列
df_selected = df[['age', 'income', 'score']]
print(df_selected)
```
输出结果如下:
```
age income score
0 22 5000 90
1 25 6000 85
2 35 8000 80
3 28 7000 95
4 30 9000 88
```
其中,`df[['age', 'income', 'score']]` 用于提取 age、income、score 列,`df_selected` 是新的 DataFrame,存储了所提取的特征。
相关问题
Python将提取后的数据存到DataFrame中
要将提取后的数据存储到DataFrame中,你可以使用Python中的pandas库。首先,你需要导入pandas库,然后创建一个空的DataFrame对象,最后将提取的数据添加到该DataFrame中。
示例代码如下:
```python
import pandas as pd
# 创建空的DataFrame对象
df = pd.DataFrame(columns=['列名1', '列名2', '列名3'])
# 将提取的数据添加到DataFrame中
df.loc[len(df)] = ['值1', '值2', '值3']
df.loc[len(df)] = ['值4', '值5', '值6']
# ...
# 打印DataFrame
print(df)
```
其中,`columns`参数用于指定创建的DataFrame对象的列名,`len(df)`用于获取当前DataFrame中的行数,从而将提取的数据添加到新的一行中。你可以根据实际情况修改示例代码中的列名、值等内容。
批量提取excel中某一列存储到新的excel
你可以使用Python中的pandas库来批量提取Excel中的某一列并存储到新的Excel文件中。以下是一个示例代码:
```python
import pandas as pd
# 读取原始Excel文件
df = pd.read_excel('原始文件.xlsx')
# 提取某一列数据
column_data = df['列名']
# 创建新的DataFrame存储提取的数据
new_df = pd.DataFrame(column_data)
# 将新的DataFrame保存为新的Excel文件
new_df.to_excel('提取的列数据.xlsx', index=False)
```
请确保在运行代码之前已经安装了pandas库。请将代码中的"原始文件.xlsx"替换为你实际的原始Excel文件名,"列名"替换为你想要提取的列的名称。代码将提取该列的数据并保存为名为"提取的列数据.xlsx"的新Excel文件。
注意:如果你的Excel文件不是`.xlsx`格式,而是`.xls`格式,你需要使用`pd.read_excel`函数的`engine='xlrd'`参数来读取该文件。同时,如果你想要提取多个列,你可以传入一个列名列表,例如`column_data = df[['列名1', '列名2', '列名3']]`。