python 数据框 提取某两列
时间: 2023-10-26 18:15:41 浏览: 37
可以使用 pandas 库中的 DataFrame,使用 loc 或 iloc 方法提取某两列的数据。具体代码如下:
```python
import pandas as pd
# 创建一个数据框
df = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c'], 'col3': [4.0, 5.0, 6.0]})
# 提取 col1 和 col2 两列数据
df_new = df.loc[:, ['col1', 'col2']]
```
这样就可以得到 `df` 中的 `col1` 和 `col2` 列数据,存储在 `df_new` 中。
相关问题
提取某一列的字符串分成两列数据python
可以使用字符串的split()方法和列表解析来实现这个功能。假设我们要将字符串列中的每个字符串按照空格分隔成两个部分,并分别放到两个新列中,可以按照以下步骤操作:
1. 定义一个包含所有字符串列的列表,假设为strings_list。
2. 使用列表解析将每个字符串按照空格分隔成两个部分,并将其放到一个新的列表中。这可以使用split()方法和列表解析来实现,例如:
```
split_strings = [[s.split()[0], s.split()[1]] for s in strings_list]
```
这将返回一个包含所有分隔后字符串的列表,其中每个元素也是一个包含两个元素的列表。
3. 将分隔后的字符串列表转换为一个包含两个列的数据框。这可以使用pandas库中的DataFrame函数来实现,例如:
```
import pandas as pd
df = pd.DataFrame(split_strings, columns=['Column 1', 'Column 2'])
```
这将返回一个包含两个列的数据框,其中第一列名为'Column 1',第二列名为'Column 2',并且每个列中的数据来自于分隔后的字符串列表。
将数据框中的两列提出生成一个新的数据集
假设要将数据框`df`中的两列`col1`和`col2`提出生成一个新的数据集,可以使用`loc`方法或者直接用列名索引的方式进行操作。
方法1:使用`loc`方法
```python
new_df = df.loc[:, ['col1', 'col2']]
```
方法2:使用列名索引的方式
```python
new_df = df[['col1', 'col2']]
```
两种方法的效果是一样的,都可以提取出`col1`和`col2`列,生成一个新的数据集`new_df`。需要注意的是,这种方法只是提取了`col1`和`col2`列,如果需要保留其他列,可以在`loc`方法或者列名索引的方式中加入需要保留的列名。例如:
```python
new_df = df.loc[:, ['col1', 'col2', 'col3']]
```
或者:
```python
new_df = df[['col1', 'col2', 'col3']]
```
其中`col3`是需要保留的列名。