Python数据分析之pandas基本数据结构:Series、DataFrame
时间: 2023-06-27 22:02:45 浏览: 239
在Python数据分析中,pandas是一个非常常用的数据处理库。pandas中的两种基本数据结构是Series和DataFrame。
Series是一维数组,其中的每个元素都有一个索引。可以将Series看作是一个带有索引的数组或一个带有标签的列表。
DataFrame是二维表格,其中的每个元素都有一个行索引和一个列索引。可以将DataFrame看作是一个带有标签的、多列的表格或一个带有标签的、异构数据的字典。
在pandas中,可以通过以下方式创建Series和DataFrame:
创建Series:
```python
import pandas as pd
s = pd.Series([1, 3, 5, np.nan, 6, 8])
```
创建DataFrame:
```python
import pandas as pd
import numpy as np
data = {'name': ['Tom', 'Jack', 'Steve', 'Ricky'],
'age': [28, 34, 29, 42],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
```
可以通过访问Series和DataFrame的属性和方法来进行数据处理和分析,例如:
```python
# 访问Series的属性
s.values
s.index
# 访问DataFrame的属性
df.columns
df.head()
df.tail()
df.describe()
df.sort_values(by='age')
```
阅读全文