python的数据处理
时间: 2023-11-06 21:02:26 浏览: 66
python的数据处理可以使用numpy和pandas库来进行。其中,numpy提供了多维数组的创建和操作方法,而pandas则提供了更高级的数据结构和数据分析功能。
在numpy中,可以使用array方法创建一维、二维以及多维数组。每增加一维,则增加一层嵌套关系。例如,可以通过以下代码创建一维、二维和三维数组:
```python
import numpy as np
data1 = [1, 2, 3, 4, 5]
array1 = np.array(data1)
data2 = [[1, 2, 3], [4, 5, 6]]
array2 = np.array(data2)
data3 = [[[1, 2, 3], [4, 5, 6]]]
array3 = np.array(data3)
```
可以使用`ndim`属性查看数组的维度,使用`shape`属性查看数组的维度大小。例如,可以通过以下代码查看二维数组的维度和维度大小:
```python
array2.ndim
array2.shape
```
在pandas中,可以使用`cut()`函数对数据进行分组处理并打上标签。被切分的数组必须是一维的。例如,可以使用以下代码将年龄数据平分成5个区间,并打上婴儿、青年、中年、壮年、老年的标签:
```python
import numpy as np
import pandas as pd
ages = np.array([0, 5, 10, 40, 36, 12, 58, 62, 77, 89, 100, 18, 20, 25, 30, 32])
tages = pd.cut(ages, [0, 5, 20, 30, 50, 100], labels=["婴儿", "青年", "中年", "壮年", "老年"])
df1 = pd.DataFrame({'age': ages, 'tage': tages})
```
在数据处理中,经常需要进行数据抽样。可以使用numpy的`random.randint()`函数生成随机数。例如,可以使用以下代码生成3个0到10之间的随机整数:
```python
import numpy as np
np.random.randint(0, 10, 3)
```
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)