基于Python数据分析之pandas统计分析_商业统计分析和数据挖掘 - CSDN文库

80 浏览量更新于2023-05-10 评论收藏 290KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

基于基于Python数据分析之数据分析之pandas统计分析统计分析

主要介绍了基于Python数据分析之pandas统计分析，具有很好对参考价值，希望对大家有所帮助。一起跟随小

编过来看看吧

pandas模块为我们提供了非常多的描述性统计分析的指标函数，如总和、均值、最小值、最大值等，我们来具体看看这些函

数：

1、随机生成三组数据、随机生成三组数据

import numpy as np

import pandas as pd

np.random.seed(1234)

d1 = pd.Series(2*np.random.normal(size = 100)+3)

d2 = np.random.f(2,4,size = 100)

d3 = np.random.randint(1,100,size = 100)

2、统计分析用到的函数、统计分析用到的函数

d1.count() #非空元素计算

d1.min() #最小值

d1.max() #最大值

d1.idxmin() #最小值的位置，类似于R中的which.min函数

d1.idxmax() #最大值的位置，类似于R中的which.max函数

d1.quantile(0.1) #10%分位数

d1.sum() #求和

d1.mean() #均值

d1.median() #中位数

d1.mode() #众数

d1.var() #方差

d1.std() #标准差

d1.mad() #平均绝对偏差

d1.skew() #偏度

d1.kurt() #峰度

d1.describe() #一次性输出多个描述性统计指标

必须注意的是，descirbe方法只能针对序列或数据框，一维数组是没有这个方法的

自定义一个函数，将这些统计指标汇总在一起：

def status(x) :

return pd.Series([x.count(),x.min(),x.idxmin(),x.quantile(.25),x.median(),

x.quantile(.75),x.mean(),x.max(),x.idxmax(),x.mad(),x.var(),

x.std(),x.skew(),x.kurt()],index=['总数','最小值','最小值位置','25%分位数',

'中位数','75%分位数','均值','最大值','最大值位数','平均绝对偏差','方差','标准差','偏度','峰度'])

执行该函数，查看一下d1数据集的这些统计函数值：

df = pd.DataFrame(status(d1))

df

结果：

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余7页未读，立即下载

评论0

weixin_38712899

粉丝: 4
资源: 941

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈