python 数组 使用
时间: 2024-12-26 19:17:30 浏览: 3
### 使用NumPy中的N维数组
在Python中处理数值数据时,`ndarray` 是 NumPy 库的核心对象之一。这种多维数组提供了高效的存储方式以及丰富的操作函数来处理大规模的数据集[^1]。
#### 创建和检查数组
可以利用多种方法创建 `ndarray` 对象:
- **从列表或其他序列类型转换而来**
```python
import numpy as np
my_list = [1, 2, 3]
array_from_list = np.array(my_list)
```
- **通过特定功能生成**
- 填充指定形状的全0或全1矩阵:
```python
zeros_array = np.zeros((3, 4)) # 形状为(3,4)的零矩阵
ones_array = np.ones((2, 3)) # 形状为(2,3)的一矩阵
```
- 构建具有固定间隔值的空间向量:
```python
linspace_example = np.linspace(start=0, stop=10, num=5)
```
为了查看已创建数组的信息,比如其维度大小、元素总数等,可调用如下属性:
```python
print(array_from_list.shape) # 输出 (3,)
print(zeros_array.size) # 输出 12
```
#### 组合现有数组形成新数组
当需要将多个现有的子数组拼接成更大的结构化形式时,可以通过水平堆叠(`hstack`)、垂直堆叠(`vstack`)等方式实现:
```python
A = np.eye(2) # 单位阵
B = np.full((2, 2), 7)
combined_matrix = np.vstack([np.hstack([np.zeros_like(A), A]),
np.hstack([B, B])])
```
对于更复杂的嵌套情况,则可能需要用到高级接口如 `bmat()` 函数[^2];不过需要注意的是该函数默认返回的是matrix类实例而非普通的ndarray,在必要情况下应当显式地将其转回常规数组格式。
#### 数据框列的选择
除了上述基本操作之外,有时还需要从业务逻辑相关的表格型数据集中提取感兴趣的字段作为新的视图展示出来。此时借助 Pandas 的 `.loc[]` 或者 `.iloc[]` 方法能够方便快捷地完成这一目标[^4]。
例如给定一个包含员工信息的数据帧df,从中选取姓名(name),年龄(age)及薪资(salary)三栏构成的新表单可通过下面语句获得:
```python
selected_columns_df = df[['name', 'age', 'salary']]
```
阅读全文