import pandas as pd data = pd.read_csv(r'D:\Workspace\Code\CodeForDataWarehouse_Pycharm\Market_Basket_Optimisation.csv', header=None, names=['商品名', '购买数量']) df = pd.DataFrame(data, columns=['商品名']) result = df.groupby('商品名').size().reset_index(name='数量') result.to_csv(r'D:\Workspace\Code\CodeForDataWarehouse_Pycharm\sh2_purchase_summary.csv', index=False) 预期结果为:商品名,数量 milk,3 yogurt,3 eggs,4 soup,2 turkey,4 tomatto,3 cookies,2 apples,2;实际结果为:商品名,数量 cookies,1。输出结果与预期不符,请帮我找出问题
时间: 2023-05-30 17:06:44 浏览: 208
在读取数据时,只指定了两列('商品名'和'购买数量'),并没有指定第一行为列名,所以需要加上参数header=None。而在给列名赋值时,只赋值了'商品名'一列,没有赋值'购买数量'一列,所以在分组统计时会出现问题。正确的代码应该是:
```
import pandas as pd
data = pd.read_csv(r'D:\Workspace\Code\CodeForDataWarehouse_Pycharm\Market_Basket_Optimisation.csv', header=None, names=['商品名', '购买数量'])
result = data.groupby('商品名').size().reset_index(name='数量')
result.to_csv(r'D:\Workspace\Code\CodeForDataWarehouse_Pycharm\sh2_purchase_summary.csv', index=False)
```
这样就可以得到正确的结果了。
相关问题
检查下面的代码:import pandas as pd data = pd.read_csv("F:/data/pNEUMA/20181024_dX_0900_0930.csv", split=";", header=None, skiprows=1) print(data)
这段代码存在一个问题,参数名应该是`delimiter`而不是`split`。正确的代码如下:
```
import pandas as pd
data = pd.read_csv("F:/data/pNEUMA/20181024_dX_0900_0930.csv", delimiter=";", header=None, skiprows=1)
print(data)
```
这样就可以正确读取以分号分隔的csv文件了。
import pandas as pd data = pd.read_csv("data1.csv",header=None) print(data)解释这行代码
这行代码的作用是导入Pandas库,并使用`pd`作为别名。然后,它使用`read_csv()`函数从名为"data1.csv"的文件中读取数据,并将其存储在名为`data`的Pandas数据框中。`header=None`表示数据文件中没有标题行,因此将数据文件的第一行也作为数据的一部分读入。最后,代码打印出`data`数据框的内容。
阅读全文