数据框练习 · 1.读取good2.csv数据集 ·2.得到马夹的商品情况 ·3.获得所有7天销量大于150且30天销量大于1000的商品情况 · 4.返回标价缺失值所在 ·5.计算所有羽绒服商品浏览
时间: 2024-10-07 12:03:14 浏览: 1
数据框练习通常涉及到对表格型数据的操作,这里给出针对`good2.csv`数据集的一些步骤说明:
1. **读取数据**:
使用pandas库的`read_csv()`函数,你可以从CSV文件中加载数据到DataFrame对象中,例如:
```python
import pandas as pd
df = pd.read_csv('good2.csv')
```
2. **获取特定商品信息**:
若要得到马夹的商品情况,假设"Ma Ji"列表示马夹,你可以筛选出该列值为"马夹"的数据行:
```python
jacket_items = df[df['Ma Ji'] == '马夹']
```
3. **条件过滤商品销量**:
筛选出7天销量大于150且30天销量大于1000的商品,可以这样操作:
```python
condition_1 = df['7_day_sales'] > 150
condition_2 = df['30_day_sales'] > 1000
popular_items = df[condition_1 & condition_2]
```
4. **检查标价缺失值**:
判断缺失值可以使用`isna()`方法,找到标价(Price)列中缺失值的位置:
```python
missing_prices = df[df['Price'].isna()]
```
5. **计算羽绒服浏览量**:
假设"Cloth Type"列标识衣物类型,羽绒服的类型可能是"羽绒服"或其他指定的标签。首先筛选出羽绒服,然后统计浏览量(假设列名是"Browsing Count"):
```python
down_jackets = df[df['Cloth Type'] == '羽绒服']
browsing_count_downjackets = down_jackets['Browsing Count'].sum()
```