根据所给的江苏旅游景点.xlsx数据,分析完成以下任务: (1)读取江苏旅游景点.xlsx数据文件。(3分) (2)查看数据基本基本信息,包括数据长度、数据类型、数据的列标签。(4分) (3)进行数据预处理,包括数据空缺值检测与处理,重复值检测与处理。列标签星级缺失值使用“未定级”进行填充。(5分) (4)找出评分大于4的景区数据。(3分) (5)根据销量给用户推荐前8的景区名称,并使用漏斗图绘制景点销量前8的景区。(7分) (6)使用饼图绘制江苏省4A,5A景区所占比例(5) (6)使用饼图绘制江苏省每个市5A级景区数量所占比例。(7分) (7)用折线图表示扬州市不同景点的销量(6分)
时间: 2024-01-29 17:04:51 浏览: 98
很抱歉,作为AI语言模型,我无法直接操作本地文件,也无法绘制图表。但我可以为您提供相应的代码和思路,供您参考。
任务1:
使用 pandas 库中的 read_excel 方法读取江苏旅游景点.xlsx 文件,代码如下:
```python
import pandas as pd
data = pd.read_excel('江苏旅游景点.xlsx')
```
任务2:
使用 pandas 库中的 info 方法查看数据基本信息,代码如下:
```python
data.info()
```
任务3:
数据预处理包括数据空缺值检测与处理,重复值检测与处理和缺失值填充。代码如下:
```python
# 检测空缺值
print(data.isnull().sum())
# 处理重复值
data.drop_duplicates(inplace=True)
# 缺失值填充
data['星级'].fillna('未定级', inplace=True)
```
任务4:
找出评分大于4的景区数据,代码如下:
```python
data[data['评分']>4]
```
任务5:
根据销量给用户推荐前8的景区名称,并使用漏斗图绘制景点销量前8的景区。代码如下:
```python
# 推荐前8的景区名称
top8 = data.sort_values(by='销量', ascending=False)['景区名称'].tolist()[:8]
print(top8)
# 绘制漏斗图
from pyecharts import options as opts
from pyecharts.charts import Funnel
funnel = (
Funnel()
.add("", [(i, data.loc[data['景区名称']==i, '销量'].item()) for i in top8])
.set_global_opts(title_opts=opts.TitleOpts(title="景点销量前8"))
)
funnel.render_notebook()
```
任务6:
使用饼图绘制江苏省4A,5A景区所占比例,代码如下:
```python
from pyecharts import options as opts
from pyecharts.charts import Pie
# 江苏省4A,5A景区所占比例
labels = ['4A级', '5A级']
values = [data[data['星级']=='4A级'].shape[0], data[data['星级']=='5A级'].shape[0]]
pie = (
Pie()
.add("", [list(z) for z in zip(labels, values)])
.set_colors(['#C23531', '#2F4554'])
.set_global_opts(title_opts=opts.TitleOpts(title="江苏省4A,5A景区所占比例"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)
pie.render_notebook()
```
任务7:
使用饼图绘制江苏省每个市5A级景区数量所占比例,代码如下:
```python
# 江苏省每个市5A级景区数量所占比例
city_count = data[data['星级']=='5A级']['所在城市'].value_counts()
labels = city_count.index.tolist()
values = city_count.tolist()
pie = (
Pie()
.add("", [list(z) for z in zip(labels, values)])
.set_global_opts(title_opts=opts.TitleOpts(title="江苏省每个市5A级景区数量所占比例"))
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
)
pie.render_notebook()
```
任务8:
用折线图表示扬州市不同景点的销量,代码如下:
```python
from pyecharts import options as opts
from pyecharts.charts import Line
# 扬州市不同景点的销量
yangzhou_data = data[data['所在城市']=='扬州市']
attr = yangzhou_data['景区名称'].tolist()
values = yangzhou_data['销量'].tolist()
line = (
Line()
.add_xaxis(attr)
.add_yaxis("", values)
.set_global_opts(title_opts=opts.TitleOpts(title="扬州市不同景点的销量"))
)
line.render_notebook()
```
阅读全文
相关推荐
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![xlsx](https://img-home.csdnimg.cn/images/20241231045042.png)