模拟某商场2020年12个月的服装、化妆品、日用品的销售量,建立名为sales的数据库对象。要求: (1) 销售数据使用随机数生成(每种商品的销量都不超过50),使用时间序列对象作为数据库的行索引。 (2) 查询6月份‘化妆品’的销售量。 (3) 查询5月份和10月份的销售记录。 (4) 查询‘服装’销量为20~35的销售记录。 (5) 查询‘服装’和‘化妆品’销量都超过30的销售记录。 (6) 按‘日用品’销量的降序排序(返回新的数据框对象)。 (7) 统计2020年各商品的销售总量。 (8) 统计每个
时间: 2024-03-20 21:42:47 浏览: 44
一个商场数据库分析,详细的数据建立字段
月份各商品的销售总量。
(1) 代码实现:
```python
import numpy as np
import pandas as pd
# 生成随机销售数据
sales_data = np.random.randint(1, 51, size=(12, 3))
dates = pd.date_range('2020-01-01', periods=12, freq='M')
sales = pd.DataFrame(sales_data, index=dates, columns=['服装', '化妆品', '日用品'])
print('销售数据:')
print(sales)
```
(2) 代码实现:
```python
# 查询6月份‘化妆品’的销售量
june_sales = sales.loc['2020-06', '化妆品']
print('6月份‘化妆品’的销售量:')
print(june_sales)
```
(3) 代码实现:
```python
# 查询5月份和10月份的销售记录
may_oct_sales = sales.loc[['2020-05', '2020-10'], :]
print('5月份和10月份的销售记录:')
print(may_oct_sales)
```
(4) 代码实现:
```python
# 查询‘服装’销量为20~35的销售记录
selected_sales = sales[(sales['服装'] >= 20) & (sales['服装'] <= 35)]
print('‘服装’销量为20~35的销售记录:')
print(selected_sales)
```
(5) 代码实现:
```python
# 查询‘服装’和‘化妆品’销量都超过30的销售记录
selected_sales = sales[(sales['服装'] > 30) & (sales['化妆品'] > 30)]
print('‘服装’和‘化妆品’销量都超过30的销售记录:')
print(selected_sales)
```
(6) 代码实现:
```python
# 按‘日用品’销量的降序排序
sorted_sales = sales.sort_values('日用品', ascending=False)
print('按‘日用品’销量的降序排序:')
print(sorted_sales)
```
(7) 代码实现:
```python
# 统计2020年各商品的销售总量
sum_by_product = sales.sum()
print('2020年各商品的销售总量:')
print(sum_by_product)
```
(8) 代码实现:
```python
# 统计每个月份各商品的销售总量
sum_by_month = sales.sum(axis=1)
print('每个月份各商品的销售总量:')
print(sum_by_month)
```
阅读全文