python简单的数据分析案列
时间: 2023-07-11 21:58:32 浏览: 51
好的,以下是一个简单的 Python 数据分析案例,使用了 Pandas 库和 Matplotlib 库:
假设我们有一份销售数据,包含了产品名称、销售数量和销售价格。我们想要分析这份数据,找出销售数量和销售价格的关系,并且找出销售数量最多的产品。
首先,我们需要导入 Pandas 和 Matplotlib 库,并且读取数据集:
```python
import pandas as pd
import matplotlib.pyplot as plt
#读取数据
data = pd.read_csv('sales_data.csv')
```
然后,我们可以使用 Pandas 库的 describe() 方法来获取数据的基本统计信息:
```python
#获取数据的基本统计信息
print(data.describe())
```
接下来,我们可以使用 Matplotlib 库来绘制销售数量和销售价格的散点图,查看它们之间的关系:
```python
#绘制销售数量和销售价格的散点图
plt.scatter(data['sales_qty'], data['sales_price'])
plt.xlabel('Sales Quantity')
plt.ylabel('Sales Price')
plt.show()
```
最后,我们可以使用 Pandas 库的 sort_values() 方法和 head() 方法来找出销售数量最多的产品:
```python
#找出销售数量最多的产品
top_product = data.sort_values('sales_qty', ascending=False).head(1)
print('Top Product:', top_product['product_name'].values[0])
```
完整代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
#读取数据
data = pd.read_csv('sales_data.csv')
#获取数据的基本统计信息
print(data.describe())
#绘制销售数量和销售价格的散点图
plt.scatter(data['sales_qty'], data['sales_price'])
plt.xlabel('Sales Quantity')
plt.ylabel('Sales Price')
plt.show()
#找出销售数量最多的产品
top_product = data.sort_values('sales_qty', ascending=False).head(1)
print('Top Product:', top_product['product_name'].values[0])
```
这个简单的数据分析案例可以帮助我们了解数据集的基本情况,并且找出数据中的一些有趣的信息。你可以根据自己的需求,使用 Pandas 和 Matplotlib 库来完成更复杂的数据分析任务。