查看数据概述，包括info() describe() columns dtypes shape index 等基础数据信息python

在Python中，特别是在数据分析和处理库Pandas中，查看数据集的基础信息是非常重要的步骤。这里有一些常用函数帮助你获取数据概述： 1. **`info()`** 函数：这是最常用的函数之一，它会显示DataFrame的基本信息，如列名、非空值数量、数据类型以及内存占用等。这对于了解数据结构和缺失值情况很有帮助。 ```python df.info() ``` 2. **`describe()`** 函数：主要用于数值型列的统计描述，包括计数（非空值）、平均值、标准差、最小值、四分位数和最大值。 ```python df.describe() ``` 3. **`columns`** 属性：返回列名称列表，你可以通过索引来访问它们。 ```python df.columns ``` 4. **`dtypes`** 属性：展示每列的数据类型。 ```python df.dtypes ``` 5. **`shape`** 属性：给出DataFrame的行数和列数，即二维数组的形式（行数，列数）。 ```python df.shape ``` 6. **`index`** 或 `.index.name` 属性：如果你的数据集有索引，可以查看索引及其名称。 ```python df.index df.index.name ```

查看数据概述，包括info() describe() columns dtypes shape index 等基础数据信息，可以自行扩充。

在Python的pandas库中，有两个主要的方法可以帮助你查看数据集的基本概况： 1. `df.info()`：这个方法提供了一个简洁的概览，包括每个列的名字（column names）、非空值的数量（Non-null values）、数据类型的（Data Types），以及每列的内存占用（Memory usage）。这对于了解数据的整体结构和缺失值分布很有帮助。 ```python print(df.info()) ``` 2. `df.describe()`：主要用于数值型（numerical）列，它会计算各列的计数（count）、平均值（mean）、标准差（std）、最小值（min）、25%分位数（25%）、中位数（50%）、75%分位数（75%）和最大值（max）。对于理解数据的集中趋势和分散情况非常有用。 ```python print(df.describe(include='number')) ``` `describe()`还可以通过`include=['object']`参数来包含分类变量（categorical variables）的总结。另外，还有几个属性能获取更详细的元数据： - `df.columns`：获取所有列名的序列。 - `df.dtypes`：显示每列的数据类型。 - `df.shape`：返回一个包含行数和列数的元组，如`(rows, cols)`。 - `df.index`：返回Series对象，表示DataFrame的行索引。组合使用这些方法，你可以得到关于数据集的全面视图。

利用DataFrame（）方法新建数据，该数据包含10名学生的姓名、年龄和性别，并储存在文件中。（1）分别利用head预览前几行，利用shape获取数据表的大小，利用info获取数据类型，利用describe获取数据分布情况。（2）修改行索引为汉字；设置“姓名”为行索引；重置索引

好的，以下是针对你的问题的代码实现： ```python import pandas as pd # 定义数据 data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七', '孙八', '周九', '吴十', '郑华', '陈龙'], '年龄': [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], '性别': ['男', '男', '男', '女', '女', '男', '女', '男', '男', '女']} # 利用DataFrame()方法新建数据 df = pd.DataFrame(data) # 将数据储存在文件中 df.to_csv('students.csv', index=False) # 预览前几行 print(df.head()) # 获取数据表的大小 print(df.shape) # 获取数据类型 print(df.info()) # 获取数据分布情况 print(df.describe()) # 修改行索引为汉字 df.index = ['第一位', '第二位', '第三位', '第四位', '第五位', '第六位', '第七位', '第八位', '第九位', '第十位'] print(df) # 设置姓名为行索引 df = df.set_index('姓名') print(df) # 重置索引 df = df.reset_index() print(df) ``` 输出结果如下： ``` 姓名年龄性别 0 张三 20 男 1 李四 21 男 2 王五 22 男 3 赵六 23 女 4 钱七 24 女 (10, 3) <class 'pandas.core.frame.DataFrame'> RangeIndex: 10 entries, 0 to 9 Data columns (total 3 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 姓名 10 non-null object 1 年龄 10 non-null int64 2 性别 10 non-null object dtypes: int64(1), object(2) memory usage: 368.0+ bytes None 年龄 count 10.000000 mean 24.500000 std 3.027650 min 20.000000 25% 22.250000 50% 24.500000 75% 26.750000 max 29.000000 姓名年龄性别第一位张三 20 男第二位李四 21 男第三位王五 22 男第四位赵六 23 女第五位钱七 24 女第六位孙八 25 男第七位周九 26 女第八位吴十 27 男第九位郑华 28 男第十位陈龙 29 女年龄性别姓名张三 20 男李四 21 男王五 22 男赵六 23 女钱七 24 女孙八 25 男周九 26 女吴十 27 男郑华 28 男陈龙 29 女姓名年龄性别 0 张三 20 男 1 李四 21 男 2 王五 22 男 3 赵六 23 女 4 钱七 24 女 5 孙八 25 男 6 周九 26 女 7 吴十 27 男 8 郑华 28 男 9 陈龙 29 女 ```

阅读全文

查看数据概述，包括info() describe() columns dtypes shape index 等基础数据信息python

查看数据概述，包括info() describe() columns dtypes shape index 等基础数据信息，可以自行扩充。

相关推荐

Anaconda-Spyder安装指南与Python数据分析基础

Python数据分析：pandas基础操作指南

Python数据分析：Pandas基础操作探索

Python数据科学速查表 - Pandas 基础.pdf

Python数据分析与应用教案Pandas统计分析基础教案.docx

《Python数据分析与应用》实验二 pandas统计分析基础.docx

Python数据分析：pandas库深度解析与NBA数据实战

Python数据分析利器：pandas深度探索与NBA数据实战

数据探索与预处理：Python数据挖掘基础

数据科学基础：Python中的数据处理与分析

Python数据分析初步：从数据导入到基本统计分析

数据分析入门：使用Python进行数据清洗和预处理

掌握核心Python数据挖掘算法：精通数据科学的关键步骤

读取mtcars数据集并实现以下操作: (1)查看mtcars数据集的维度、大小等信息 (2)使用describe方法对整个mtcars数据集进行描述性统计 (3)计算不同cyl(气缸数)、crab(化油器)对应的mpg(油耗)和hp(马力)的均值 python语言

python数据处理常用代码

7. 读取mtcars数据集并实现以下操作： （1）查看mtcars数据集的维度、delattr小等信息。 （2）使用describe方法对整个mtcars数据集进行描述性统计。 （3）计算不同cyl(气缸数)、carb(化油器)对应的mpg(油耗)和hp(马力)的均值。

Python数据分析基础：从入门到Pandas操作

Python数据分析入门：pandas基础操作详解

最新推荐

Python数据科学速查表 - Pandas 基础.pdf

pandas大数据分析笔记.docx

autocorr-vi-5.3.6.1-24.el7.noarch.rpm.zip

Angular程序高效加载与展示海量Excel数据技巧

管理建模和仿真的文件

【SecureCRT高亮技巧】：20年经验技术大佬的个性化设置指南

如何设计一个基于FPGA的多功能数字钟，实现24小时计时、手动校时和定时闹钟功能？

Argos客户端开发流程及Vue配置指南

"互动学习：行动中的多样性与论文攻读经历"

【SecureCRT高亮规则深度解析】：让日志输出一目了然的秘诀

7. 读取mtcars数据集并实现以下操作：（1）查看mtcars数据集的维度、delattr小等信息。（2）使用describe方法对整个mtcars数据集进行描述性统计。（3）计算不同cyl(气缸数)、carb(化油器)对应的mpg(油耗)和hp(马力)的均值。