随机选择/下载一个数据集,或生成一些数据 1.绘制盒装图、柱状图、散点图、折线图等
时间: 2024-10-11 14:07:34 浏览: 27
随机选择并下载数据集通常需要访问像Kaggle、UCI Machine Learning Repository或者Python的数据科学库如pandas-datareader这样的资源。例如,你可以使用`pandas.read_csv()`从CSV文件加载数据,或者`requests`库配合`urllib`来下载网络上的数据。
对于生成数据,Python的`numpy`和`scipy`库提供丰富的函数,可以生成各种类型的随机数据,比如正态分布、均匀分布等。`matplotlib`则可以用来绘制各类图表,例如:
```python
import numpy as np
import matplotlib.pyplot as plt
# 生成随机数据
data = np.random.randn(50) # 生成50个标准正态分布的随机数
# 绘制箱形图
plt.boxplot(data)
plt.title('Box plot')
plt.show()
# 绘制柱状图
column_data = [np.random.randint(1, 100, size=25) for _ in range(4)] # 每列有25个随机整数
plt.bar(range(4), column_data)
plt.title('Bar chart')
plt.show()
# 散点图和折线图类似,可以使用scatter()和plot()函数
x = np.linspace(0, 10, 100)
y = x ** 2
plt.scatter(x, y)
plt.plot(x, y)
plt.legend(['Scatter', 'Linear'])
plt.show()
```
阅读全文