查询dataframe表基本信息
时间: 2023-05-20 22:04:35 浏览: 87
你可以使用 pandas 库中的 dataframe.describe() 方法来查询 dataframe 表的基本信息,包括表的行数、列数、数据类型、均值、标准差、最小值、最大值等。示例代码如下:
import pandas as pd
# 读取 csv 文件并转换为 dataframe 表
df = pd.read_csv('data.csv')
# 查询 dataframe 表的基本信息
print(df.describe())
相关问题
pandasdataframe的基本操作
Pandas DataFrame 是 Python 中使用最广泛的数据结构之一,它采用表格的形式存储数据,类似于 Excel 中的表格。DataFrame 可以进行多种操作,如数据整理、切片、查询、聚合等。
1. 创建 DataFrame
可以通过 pandas.read_csv(),pandas.read_excel() 等方法导入已有数据文件,也可以手动创建。使用 pandas.DataFrame() 方法,将数据数组传递给 DataFrame 的构造函数即可创建 DataFrame。例如,以下创建一个有两个列的 DataFrame:
```python
import pandas as pd
data = {'name': ['Tom', 'Jerry'], 'age': [25, 30]}
df = pd.DataFrame(data)
```
2. 基本信息查看
使用 df.head() 和 df.tail() 方法可以查看 DataFrame 的头几行或尾几行数据,默认显示前五行或后五行。
使用 df.shape 可以查看行列数。
使用 df.info() 可以查看每一列的名字、数据类型和缺失值数量。
3. 数据选择与切片
可以使用 df.loc[] 和 df.iloc[] 方法选择行和列。
df.loc[] 通过标签选择数据,可以选择一行或多行数据。例如,选取第一行数据:
```python
df.loc[0]
```
df.iloc[] 通过位置选择数据,也可以选择一行或多行。例如,选取第一行数据:
```python
df.iloc[0]
```
可以通过 df["column_name"] 选取列。例如,以下选取列 name:
```python
df["name"]
```
4. 数据过滤与查询
可以通过布尔索引过滤数据。例如,以下选取 age 大于 25 的行:
```python
df[df["age"] > 25]
```
可以使用 df.query() 方法查询数据。例如,以下查询名字为 Tom 的行:
```python
df.query("name == 'Tom'")
```
5. 数据处理与聚合
可以使用 df.apply() 方法处理数据。例如,以下将 age 列中的数据加 10:
```python
df["age"] = df["age"].apply(lambda x: x + 10)
```
可以使用 df.groupby() 方法进行数据聚合。例如,以下对 age 列进行平均数聚合:
```python
df.groupby("age")["age"].mean()
```
以上是 Pandas DataFrame 的基本操作,包括创建 DataFrame、基本信息查看、数据选择与切片、数据过滤与查询、数据处理与聚合等。通过这些方法可以轻松地对 DataFrame 进行操作,方便地进行数据分析和处理。
dataframe基本用法
DataFrame是Pandas库中的一种数据结构,可以看作是由多个Series组成的表格型数据结构。DataFrame的行和列都可以进行索引,可以进行数据筛选、切片、排序、统计等操作。
创建DataFrame:
```python
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Mickey', 'Minnie'],
'age': [20, 22, 25, 23],
'gender': ['M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
```
上述代码创建了一个DataFrame,其中包含了4个人的姓名、年龄和性别。
查询DataFrame:
```python
# 查看DataFrame前5行数据
df.head()
# 查看DataFrame基本信息,包括行列数、数据类型、数据缺失情况等
df.info()
# 查看DataFrame中的某一列
df['name']
# 查看DataFrame中的多列
df[['name', 'age']]
# 查看DataFrame中的某一行
df.loc[0]
# 查看DataFrame中的多行
df.loc[[0, 2]]
# 查看DataFrame中的某个位置的值
df.loc[0, 'name']
```
修改DataFrame:
```python
# 修改DataFrame中的某个值
df.loc[0, 'age'] = 21
# 为DataFrame增加一列
df['height'] = [170, 175, 180, 165]
# 删除DataFrame中的一行
df.drop(index=0, inplace=True)
# 对DataFrame进行排序
df.sort_values(by='age', inplace=True)
# 对DataFrame进行筛选
df[df['gender'] == 'M']
```
以上是DataFrame的基本用法,实际应用中还可以进行更多的操作,如数据清洗、数据合并、数据分组等,可以根据具体需求进行学习和使用。
阅读全文