import pandas as pd # Pandas 导入表格需要用到 import numpy as np # Numpy (version : 1.19.2) 进行数值运算或者矩阵运算 import matplotlib.pyplot as plt # Matplotlib 绘图包,也可以采用seaborn from sklearn.cluster import KMeans # Scikit Learn 机器学习聚类软件包,可以直接进行聚类。续写这段代码,对导入的csv文件进行列的描述统计性分析,csv文件共5列200行,第一列为客户编号,第二列为客户性别,第三列为客户年龄,第四列为客户年收入,第五列为客户年支出
时间: 2024-02-15 09:01:49 浏览: 78
numpy-1.19.2.zip
假设我们已经将csv文件导入到名为"df"的Pandas数据框中,下面是对各列进行描述统计性分析的代码:
```
# 对客户年龄、年收入、年支出进行描述统计性分析
print(df[['客户年龄', '客户年收入', '客户年支出']].describe())
# 对客户性别进行计数
print(df['客户性别'].value_counts())
```
以上代码会输出每列数据的统计性描述,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。同时,它还会输出客户性别的计数,以便对客户群体进行更深入的分析。
阅读全文