选取表中非连续的两列重新创建数据框
时间: 2024-02-23 17:59:58 浏览: 24
您好!要选取表中非连续的两列重新创建数据框,可以使用以下代码:
```r
# 原始数据框
original_df <- data.frame(
A = c(1, 2, 3, 4, 5),
B = c("a", "b", "c", "d", "e"),
C = c(6, 7, 8, 9, 10),
D = c("f", "g", "h", "i", "j")
)
# 选取非连续的两列
new_df <- original_df[, c("A", "C")]
# 查看新数据框
new_df
```
这里,我们首先创建了一个原始数据框`original_df`,其中包含4列数据。然后,使用`[, c("A", "C")]`选取了非连续的两列"A"和"C",并将其赋值给新的数据框`new_df`。最后,使用`new_df`查看新数据框的内容。
运行上述代码,即可得到选取非连续的两列后的新数据框。
相关问题
DataFrame选取两列数据
可以使用 Pandas 的 loc 或 iloc 方法来选取 DataFrame 中的两列数据。
假设有一个 DataFrame 叫做 df,其中包含了三列数据,分别为 A、B、C,选取 A 和 B 两列数据的代码如下:
使用 loc 方法:
```
df.loc[:, ['A', 'B']]
```
使用 iloc 方法:
```
df.iloc[:, [0, 1]]
```
其中 loc 方法中的冒号表示选取所有行,中括号中的列表表示选取列名为 A 和 B 的两列数据。
而 iloc 方法中的冒号和列表分别代表选取所有行和选取第 1 和第 2 列数据(因为 Python 中的索引是从 0 开始的)。
选取完两列数据后,可以将结果赋值给新的 DataFrame 或者直接对选取结果进行其他的操作。
dataframe选取指定的两列数据
可以使用pandas的DataFrame的切片操作来选取指定的两列数据。以下是一个例子:
```python
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
# 选取指定的两列数据
selected_data = data[['column1', 'column2']]
```
其中,`data`是读取的csv文件的DataFrame对象,`column1`和`column2`是需要选取的两列数据的列名。选取后的结果存储在`selected_data`中,也是一个DataFrame对象。