jupyter导报df
时间: 2023-12-30 15:24:30 浏览: 91
开放导报论文模板.doc
在Jupyter Notebook中导入和展示DataFrame可以使用以下方法:
1. 导入pandas库并读取数据文件:
```python
import pandas as pd
df = pd.read_csv("data.csv")
```
2. 使用`df.head()`方法显示DataFrame的前几行数据:
```python
df.head()
```
3. 使用`df.info()`方法显示DataFrame的基本信息,包括列名、非空值数量和数据类型等:
```python
df.info()
```
4. 使用`df.describe()`方法显示DataFrame的统计摘要,包括计数、均值、标准差、最小值、最大值等:
```python
df.describe()
```
5. 使用`df.shape`属性获取DataFrame的形状,即行数和列数:
```python
df.shape
```
6. 使用`df.columns`属性获取DataFrame的列名列表:
```python
df.columns
```
7. 使用`df["column_name"]`或`df.column_name`获取DataFrame中指定列的数据:
```python
df["column_name"]
df.column_name
```
8. 使用`df.iloc[row_index, column_index]`获取DataFrame中指定位置的数据:
```python
df.iloc[row_index, column_index]
```
9. 使用`df.loc[row_label, column_label]`获取DataFrame中指定标签的数据:
```python
df.loc[row_label, column_label]
```
10. 使用`df.groupby("column_name").agg({"column_name": "count"})`对DataFrame进行分组并计数:
```python
df.groupby("column_name").agg({"column_name": "count"})
```
11. 使用`df["new_column"] = df["column1"] + df["column2"]`创建新的列并进行计算:
```python
df["new_column"] = df["column1"] + df["column2"]
```
阅读全文