陈俊辉数据分析实例 - Jupyter Notebook.pdf - CSDN文库

1星需积分: 46 66 浏览量更新于2023-03-03 12 收藏 444KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

In[]:

In[2]:

所有权

学历

婚姻

职业

家庭成员

人种

性别

国家

收入

数据分析实例--美国人收入的分析（样本个数32000）

1、导入数据，完成分列

2、处理空值和异常数据，完成数据汇总

3、年龄段与收入情况关系的柱状图

4、学历与收入情况关系的柱状图

5、受教育年限与收入情况关系的折线图

6、人种与收入情况关系的饼状图

7、性别与收入情况关系的饼状图

8、初试机器学习，建立线性逻辑回归预测模型，采用新数据测试模型

import pandas as pd

import os

os.getcwd()

df=pd.read_csv('adult2.txt',sep=',',header=None,names=['年龄','所有权','删除1','学历','受教育年限','婚姻'

'家庭成员','人种','性别','删除2','删除3','删除5'

df2=df.drop(['删除1','删除2','删除3','删除5'],axis=1).copy()

df2.columns.to_list()

for i in df2.columns.to_list():

if i=='年龄' or i=='受教育年限':

continue

print(i)

df2[i]=df2[i].str.strip()

剩余12页未读，继续阅读

weixin_42440491

粉丝: 0
资源: 1

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈