numpy和pandas库的使用
时间: 2023-12-03 10:35:42 浏览: 35
numpy和pandas是Python中常用的数据分析库。numpy提供了高性能的多维数组对象以及相应的操作函数,而pandas则提供了用于数据处理和数据分析的数据结构和函数。
在使用numpy时,一般首先需要导入numpy库:
```python
import numpy as np
```
然后可以创建一个numpy数组:
```python
a = np.array([1, 2, 3])
```
也可以创建一个二维数组:
```python
b = np.array([[1, 2, 3], [4, 5, 6]])
```
numpy还提供了许多数组操作函数,比如求和、求平均值、矩阵乘法等:
```python
c = np.sum(b) # 求和
d = np.mean(b) # 求平均值
e = np.dot(b, b.T) # 矩阵乘法
```
在使用pandas时,一般首先需要导入pandas库:
```python
import pandas as pd
```
然后可以创建一个Series对象:
```python
s = pd.Series([1, 2, 3])
```
也可以创建一个DataFrame对象:
```python
df = pd.DataFrame({'A': [1,2, 3], 'B': [4, 5, 6]})
```
pandas提供了许多数据处理和分析的函数,比如数据排序、数据筛选、数据合并等:
```python
df1 = df.sort_values(by='B') # 按B列排序
df2 = df[df['A'] > 1] # 筛选A列大于1的行
df3 = pd.merge(df1, df2, on='B', how='outer') # 按B列合并df1和df2
```