numpy库入门教程:从数组创建到矩阵运算

需积分: 15 2 下载量 185 浏览量 更新于2024-09-08 收藏 7KB MD 举报
"学习numpy库" numpy是Python中用于科学计算的核心库,提供了高效的多维数组对象和各种数学操作。这个库对于数据处理和分析非常重要,尤其在机器学习和数据分析领域。以下是对numpy库中关键概念的详细解释: **一、数组** 1、**数组创建**:`numpy.array()`函数用于创建数组,可以接受列表、元组或其他序列作为参数。通过指定`dtype`参数,可以定义数组中元素的数据类型。 ```python # 创建二维数组 a = np.array([['张','男','19'],['李','女','20']], dtype='object') # 使用arange快速生成数组 np.arange(start, stop, step) # start初始值,stop停止值(不包含),step步长 # linspace在指定范围内等间距生成数组 np.linspace(start, stop, num, endpoint=True/False) ``` 2、**数组属性**: - `ndim`:返回数组的维度。 - `shape`:返回一个元组,表示数组的行数和列数。 - `size`:返回数组元素的总数量。 - `dtype`:返回数组中元素的数据类型。 - `itemsize`:单个元素占用的字节数。 - `nbytes`:数组占用的总字节数(`size * itemsize`)。 **二、缺失值问题**: 在numpy中,缺失值通常表示为`np.nan`(Not a Number)。当数组中出现`None`或`NaN`时,数据类型通常会自动转换为`float`。 ```python # 创建包含缺失值的数组 a = np.array([1, 2, None]) ``` **三、特殊数组**: numpy提供了许多预定义的特殊数组,如全零数组`np.zeros()`,全一数组`np.ones()`,单位矩阵`np.eye()`等。 **四、`np.random`模块**: 该模块提供了各种随机数生成函数,如`np.random.rand()`(0到1之间的均匀分布)、`np.random.randn()`(标准正态分布)等。 **五、数组的排序**: 可以使用`np.sort()`对数组进行排序,`np.argsort()`返回排序后的索引。 **六、数组的重塑**: `reshape()`函数可以改变数组的形状,但必须保持总元素数量不变。 **七、索引和切片**: numpy数组支持类似于Python列表的索引和切片操作,可以访问和修改数组的特定部分。 **八、数组的合并**: 使用`concatenate()`、`stack()`或`vstack()`、`hstack()`等函数可以将多个数组合并。 **九、数组的运算**: 包括基本的算术运算(加、减、乘、除)、比较运算、逻辑运算以及广播机制。 **十、通用函数**: `numpy`提供了很多针对数组的通用函数(ufuncs),如`np.sum()`, `np.mean()`, `np.max()`等,可以对整个数组或其轴进行计算。 **十一、`np.char`模块**: 该模块提供了处理数组中字符串的方法,如`np.char.upper()`、`np.char.join()`等。 **十二、矩阵运算、协方差**: numpy支持矩阵乘法(`@`运算符或`dot()`函数)、转置(`T`属性)以及计算协方差矩阵(`cov()`函数)等线性代数操作。 **十三、其他常用函数**: numpy库中还有大量其他功能函数,如统计函数、数组操作函数、傅里叶变换等,为数据分析提供了丰富的工具。 通过深入学习和实践numpy库,可以极大地提高数据处理效率,并为后续的科学计算和数据分析工作打下坚实基础。