化妆品cosmetics.csv数据可视化分析
时间: 2024-04-28 16:21:46 浏览: 55
好的,化妆品cosmetics.csv数据可视化分析可以帮助我们了解这个数据集的一些特征和趋势。下面是一些基本的可视化分析方法:
1. 首先,我们可以用散点图或直方图来观察每个变量的分布情况,以及它们之间的相关性。例如,我们可以用散点图来观察价格和评分之间的关系,或者用直方图来观察品牌和销售量之间的关系。
2. 我们还可以使用箱线图来观察不同品牌、不同价格区间或不同评分等级的化妆品在某个特征上的分布情况。例如,我们可以用箱线图来观察不同品牌的化妆品在价格上的分布情况,或者用箱线图来观察不同评分等级的化妆品在销售量上的分布情况。
3. 另外,我们还可以使用热力图来观察不同变量之间的相关性。例如,我们可以用热力图来观察品牌、价格、评分和销售量之间的相关性。
需要注意的是,这只是一些基本的可视化分析方法,具体的分析方法还需要根据具体的问题和数据特征来选择。
相关问题
模拟某商城2020年12个月的服装、化妆品、日用品的销量表,建立名为sales的数据框对象 要求: (1)销售数据使用随机数量生成 (每种商品的销量都不超过50),使用时间序列对象作为数据框的行索弓 (2)查询6月份“化妆品”的销售量 (3)查询5月份和10月份的销售记录........................ (4)查询“服装”销量为20~35的销售记录.................................. (5)查询“服装”和“化妆品”销售都超过30(含)的销售记录 (6)按照“日用品”销量的降序排序(返回新的数据框对象 ) (7)统计2020年各商品的销售总量 (8)统计每个月的销售总量 假设DataFrame对象为 sales,请回答以下问题1.以下代码生成12个月的时间序列,请补充完整,在第1和2空回答 start='20200101,freq=_----,perdate = paiods=l2) 2.请补充执行步骤5并输出的代码(查询“服装”和“化妆品”销售都超过30(含)的销售记录),在第3空回答print( 3.请补充执行步骤8的代码,统计每个月的销量在第4空回答 sales['Sum]= 程序文件命名为sy5_题号.py,并上传在最后一个宝
import pandas as pd
import numpy as np
# (1)生成随机销售数据
clothes = np.random.randint(50, size=12)
cosmetics = np.random.randint(50, size=12)
daily_necessities = np.random.randint(50, size=12)
# (2)生成时间序列对象
dates = pd.date_range(start='20200101', freq='M', periods=12)
# (3)建立数据框对象
sales = pd.DataFrame({'Clothes': clothes,
'Cosmetics': cosmetics,
'Daily Necessities': daily_necessities}, index=dates)
# (4)查询6月份“化妆品”的销售量
print(sales.loc['2020-06', 'Cosmetics'])
# (5)查询5月份和10月份的销售记录
print(sales.loc[['2020-05', '2020-10']])
# (6)查询“服装”销量为20~35的销售记录
print(sales[(sales['Clothes'] >= 20) & (sales['Clothes'] <= 35)])
# (7)查询“服装”和“化妆品”销售都超过30(含)的销售记录
print(sales[(sales['Clothes'] >= 30) & (sales['Cosmetics'] >= 30)])
# (8)按照“日用品”销量的降序排序(返回新的数据框对象 )
sorted_sales = sales.sort_values(by='Daily Necessities', ascending=False)
print(sorted_sales)
# (9)统计2020年各商品的销售总量
print(sales.sum())
# (10)统计每个月的销售总量
sales['Sum'] = sales.sum(axis=1)
print(sales['Sum'])
阅读全文