#描述性统计分析 import pandas as pd #读取数据文件 credit = pd.read_csv('data/credit_card.csv', encoding='GBK') #删除信用卡顾客编号属性 credit = credit.drop('信用卡顾客编号',axis=1) length = len(credit) # 计算数据量 #定义描述性统计函数,且将结果保留3位小数 def status(x): return pd.Series([x.count(), length - x.count(),len(credit.groupby(by=x)), x.max()- x.min(), x.quantile(.75) - x.quantile(.25), x.mode()[0], format(x.var(), '.3f'), format(x.skew(), '.3f'),format(x.kurt(), '.3f')], index=['非空值数','缺失值数', '类别数', '极差', '四分位差",‘众数','方差 ','偏度','峰度']) #应用描述性统计函数 describe_tb = credit.apply(status)

时间: 2023-06-20 19:05:58 浏览: 122

这段代码是用 Python 的 pandas 库对一个信用卡数据集进行描述性统计分析。具体来说，它做了以下几个步骤： 1. 用 `pd.read_csv()` 函数读取数据文件 `credit_card.csv`，并将结果存储在 `credit` 变量中。 2. 用 `credit.drop()` 函数删除数据集中的一列，即信用卡顾客编号属性，因为它对于描述性统计没有意义。 3. 用 `len()` 函数计算数据集的样本量，存储在 `length` 变量中。 4. 定义了一个函数 `status()`，该函数接受一个 pandas 的 Series 对象作为参数，返回一个包含多个描述性统计指标的 Series 对象。这些指标包括非空值数、缺失值数、类别数、极差、四分位差、众数、方差、偏度和峰度。 5. 用 `credit.apply()` 函数将 `status()` 应用到每一列数据上，得到一个包含所有变量的描述性统计结果的 DataFrame 对象 `describe_tb`。需要注意的是，在 `status()` 函数中，用到了 pandas 的一些函数和方法，例如 `x.count()`、`x.max()`、`x.min()`、`x.quantile()`、`x.mode()`、`x.var()`、`x.skew()` 和 `x.kurt()` 等，这些函数和方法分别计算了数据的非空值数量、最大值、最小值、四分位数、众数、方差、偏度和峰度等指标。此外，`format()` 函数用于将结果保留三位小数。

阅读全文

相关推荐

解决pandas使用read_csv()读取文件遇到的问题

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

快速解决pandas.read_csv()乱码的问题

23.pandas_read_csv.ipynb

csv_file.rar_csv_csv文件_python_python 读写 excel_python处理csv数据

pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类

read_csv_file_merge.zip_missing value_合并csv文件_多数据文件合并_缺失值_缺失数据

Import-from-Text-or-CSV.zip_csv_reading

CSV.rar_csv

【数据挖掘重要笔记day31】详细完解决iris = sns.load_dataset(‘iris’)出来EmptyDataError: No columns to parse from file报错

import pandas as pd.docx

python数据分析与可视化 import pandas as pd import numpy as np import m

pandas.read_csv参数全面解读与实用示例

pandas.read_csv参数全面解析：高效CSV导入与头信息处理

springboot167基于springboot的医院后台管理系统的设计与实现.zip

XGigE IP GigE Vision Streaming Protocol VHDL源码 有基于AC701 FPGA板卡的完整的参考工程

大家在看

计算机辅助安全工程第4章安全模拟与仿真ppt课件.ppt

五子棋 C++ 图形版

DSR.rar_MANET DSR_dsr_dsr manet_it_manet

c语言进行数字图像处理

KEMET_聚合物钽电容推介资料

最新推荐

macOS 10.9至10.13版高通RTL88xx USB驱动下载

PyCharm开发者必备：提升效率的Python环境管理秘籍

matlab中VBA指令集

在Windows Forms和WPF中实现FontAwesome-4.7.0图形

【Postman进阶秘籍】：解锁高级API测试与管理的10大技巧

ubuntu22.04怎么恢复出厂设置

2001年度广告运作规划：高效利用资源的策略

【Postman终极指南】：掌握API测试到自动化部署的全流程

叙述图神经网络领域近年来最新研究进展

Java实现深度优先遍历与id-level映射输出

XGigE IP GigE Vision Streaming Protocol VHDL源码有基于AC701 FPGA板卡的完整的参考工程