pandasdataframe的基本操作
时间: 2023-05-09 20:01:40 浏览: 216
Pandas DataFrame 是 Python 中使用最广泛的数据结构之一,它采用表格的形式存储数据,类似于 Excel 中的表格。DataFrame 可以进行多种操作,如数据整理、切片、查询、聚合等。
1. 创建 DataFrame
可以通过 pandas.read_csv(),pandas.read_excel() 等方法导入已有数据文件,也可以手动创建。使用 pandas.DataFrame() 方法,将数据数组传递给 DataFrame 的构造函数即可创建 DataFrame。例如,以下创建一个有两个列的 DataFrame:
```python
import pandas as pd
data = {'name': ['Tom', 'Jerry'], 'age': [25, 30]}
df = pd.DataFrame(data)
```
2. 基本信息查看
使用 df.head() 和 df.tail() 方法可以查看 DataFrame 的头几行或尾几行数据,默认显示前五行或后五行。
使用 df.shape 可以查看行列数。
使用 df.info() 可以查看每一列的名字、数据类型和缺失值数量。
3. 数据选择与切片
可以使用 df.loc[] 和 df.iloc[] 方法选择行和列。
df.loc[] 通过标签选择数据,可以选择一行或多行数据。例如,选取第一行数据:
```python
df.loc[0]
```
df.iloc[] 通过位置选择数据,也可以选择一行或多行。例如,选取第一行数据:
```python
df.iloc[0]
```
可以通过 df["column_name"] 选取列。例如,以下选取列 name:
```python
df["name"]
```
4. 数据过滤与查询
可以通过布尔索引过滤数据。例如,以下选取 age 大于 25 的行:
```python
df[df["age"] > 25]
```
可以使用 df.query() 方法查询数据。例如,以下查询名字为 Tom 的行:
```python
df.query("name == 'Tom'")
```
5. 数据处理与聚合
可以使用 df.apply() 方法处理数据。例如,以下将 age 列中的数据加 10:
```python
df["age"] = df["age"].apply(lambda x: x + 10)
```
可以使用 df.groupby() 方法进行数据聚合。例如,以下对 age 列进行平均数聚合:
```python
df.groupby("age")["age"].mean()
```
以上是 Pandas DataFrame 的基本操作,包括创建 DataFrame、基本信息查看、数据选择与切片、数据过滤与查询、数据处理与聚合等。通过这些方法可以轻松地对 DataFrame 进行操作,方便地进行数据分析和处理。
阅读全文