项目描述现有一个手机评论数据Mobile.csv文件,该文件的数据列包括手机品牌、价格和评分,请完成下列数据分析任务。(1)按手机价格统计评分最大值、最小值、算术平均值和中位数。(2)按手机品牌统计评分最大值、最小值、算术平均值和中位数。
时间: 2023-12-17 22:03:18 浏览: 94
手机_data.csv
好的,这个数据分析任务可以使用Python的pandas和numpy库来完成。首先需要读取Mobile.csv文件并将其转化为pandas数据框。假设Mobile.csv文件中的数据列依次为:Brand、Price、Rating。
读取Mobile.csv文件的代码如下:
``` python
import pandas as pd
# 读取Mobile.csv文件并转化为pandas数据框
mobile_df = pd.read_csv('Mobile.csv')
```
1. 按手机价格统计评分最大值、最小值、算术平均值和中位数。
首先需要对数据框按照Price列进行排序,然后使用pandas的agg函数对Rating列进行统计分析。代码如下:
``` python
import pandas as pd
# 读取Mobile.csv文件并转化为pandas数据框
mobile_df = pd.read_csv('Mobile.csv')
# 对数据框按照Price列进行排序
mobile_df.sort_values('Price', inplace=True)
# 使用agg函数对Rating列进行统计分析
price_stat = mobile_df.groupby('Price')['Rating'].agg(['max', 'min', 'mean', 'median'])
```
2. 按手机品牌统计评分最大值、最小值、算术平均值和中位数。
同样地,需要使用pandas的agg函数对Rating列进行统计分析,只不过这次是按照Brand列分组。代码如下:
``` python
import pandas as pd
# 读取Mobile.csv文件并转化为pandas数据框
mobile_df = pd.read_csv('Mobile.csv')
# 使用agg函数对Rating列进行统计分析,按照Brand列分组
brand_stat = mobile_df.groupby('Brand')['Rating'].agg(['max', 'min', 'mean', 'median'])
```
阅读全文