帮我找一个,可以从国内下载,可以从比较排序和局部整体,分布,时间序列4个视角对数据可视化并进行分析的数据集,并提供下载连接和可视化代码和分析
时间: 2024-06-10 11:05:36 浏览: 159
数据分析之数据之美,数据可视化之美;对数据分析感兴趣的朋友可以看过来哟!
答案:好的,请稍等一下,我会为您搜索合适的数据集和提供相关链接和代码。以下是我为您找到的数据集:
名称:UCI Machine Learning Repository
链接:http://archive.ics.uci.edu/ml/index.php
描述:UCI Machine Learning Repository 是一个经典的机器学习数据集库,提供多个数据集,可以从比较排序和局部整体、分布和时间序列4个视角对数据进行分析和可视化。
代码示例:
1. 比较排序视角:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_csv("uci_data.csv")
fig, ax = plt.subplots()
ax.bar(data['id'], data['score'])
plt.title('Score Comparison Chart')
plt.xlabel('id')
plt.ylabel('score')
plt.show()
2. 局部整体视角:
import pandas as pd
import seaborn as sns
data = pd.read_csv("uci_data.csv")
sns.boxplot(x="category", y="value", data=data)
plt.title('Value Distribution by Category')
plt.show()
3. 分布视角:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data = pd.read_csv("uci_data.csv")
fig, ax = plt.subplots()
ax.hist(data['value'])
plt.title('Value Distribution')
plt.xlabel('value')
plt.ylabel('frequency')
plt.show()
4. 时间序列视角:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv("uci_data.csv")
data['time'] = pd.to_datetime(data['time'])
data.set_index('time', inplace=True)
data.plot()
plt.title('Value by Time')
plt.xlabel('time')
plt.ylabel('value')
plt.show()
链接示例:
1. 比较排序视角:
链接:http://archive.ics.uci.edu/ml/datasets/Student+Performance
说明:这个数据集包含了葡萄牙里斯本的一个学校的学生表现情况,可以根据学生的不同特征,从比较排序的视角对其成绩进行分析。
2. 局部整体视角:
链接:http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic)
说明:这个数据集包含了乳腺癌患者的诊断数据,可以从局部整体的视角对不同类型的乳腺癌进行分析。
3. 分布视角:
链接:http://archive.ics.uci.edu/ml/datasets/Wine+Quality
说明:这个数据集包含了红葡萄酒和白葡萄酒的质量数据,可以从分布的视角对不同酒的质量进行分析。
4. 时间序列视角:
链接:http://archive.ics.uci.edu/ml/datasets/PM2.5+Data+of+Five+Chinese+Cities
说明:这个数据集包含了中国五个城市的PM2.5数据,可以从时间序列的视角对PM2.5的变化进行分析。
阅读全文