pd.DataFrame 指定列
时间: 2024-11-17 18:13:50 浏览: 3
`pd.DataFrame` 是 Pandas 库中的重要数据结构,它是一个二维表格,类似于 SQL 的表。如果你想要指定创建 DataFrame 时包含哪些列,你可以通过多种方式来实现:
1. 列名数组和值数组:可以直接传入列名列表和对应的值列表,例如:
```python
data = {
'Column1': [1, 2, 3],
'Column2': ['a', 'b', 'c']
}
df = pd.DataFrame(data)
```
这里 `Column1` 和 `Column2` 是列名,[1, 2, 3] 和 ['a', 'b', 'c'] 分别对应这两列的数据。
2. 列字典:可以将列名作为键,值为一维数组或 Series 对象:
```python
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
```
3. 初始数据结构:如果你已经有了类似的数据框或者序列,可以使用 `pd.concat()` 或者 `pd.DataFrame.from_records()` 等方法合并数据:
```python
column1_data = [1, 2, 3]
column2_data = ['a', 'b', 'c']
df = pd.DataFrame({'Column1': column1_data, 'Column2': column2_data})
```
4. 利用构造函数 `pd.DataFrame(..., columns=...)` 直接指定列名:
```python
columns = ['A', 'B', 'C']
df = pd.DataFrame(np.random.rand(3, 3), columns=columns)
```
这会生成一个 3x3 的随机数矩阵,并将其设置为指定列名。
阅读全文