生活中有哪些有趣的数据集适合大学生做数据分析
时间: 2024-01-01 11:05:29 浏览: 27
有趣的数据集有很多,以下是一些适合大学生做数据分析的数据集:
1. 世界杯历史数据:可以分析历届世界杯比赛的胜负情况、进球数、球队排名等等。
2. 电影评分数据集:可以分析影片类型、导演、演员、上映时间等因素对电影评分的影响。
3. 美国大选数据集:可以分析候选人支持率、选民群体、参选资格等因素对选举结果的影响。
4. 疫情数据集:可以分析疫情趋势、感染人数、死亡率等因素对疫情的影响。
5. 社交媒体数据集:可以分析用户行为、兴趣爱好、人口统计学数据等因素对社交媒体使用的影响。
6. 篮球比赛数据集:可以分析球员数据、球队数据、比赛数据等因素对比赛结果的影响。
希望这些数据集能给您提供一些启示,能够启发您找到更多有趣的数据集进行分析。
相关问题
适合用来做聚类分析的数据集有哪些
适合用来做聚类分析的数据集有很多,以下是一些常见的例子:
1. 购物行为数据集:可以将每个用户的购物行为看做一个向量,向量的每个维度表示一个商品的特征,比如品类、价格、销量等。
2. 用户行为数据集:可以将每个用户的行为看做一个向量,向量的每个维度表示一个行为,比如点击、购买、收藏等。
3. 电影评分数据集:可以将每个用户对电影的评分看做一个向量,向量的每个维度表示一部电影,可以使用电影的特征(如导演、演员、类型等)进行编码。
4. 文本数据集:可以将文本数据集中的每个文档看做一个向量,向量的每个维度表示一个单词,可以使用词频或者 TF-IDF 等方式进行编码。
5. 气象数据集:可以将气象数据集中的每个地区的气象指标看做一个向量,向量的每个维度表示一个气象指标,比如温度、湿度、风速等。
适合用来做聚类分析的uci数据集有哪些
有很多适合用来做聚类分析的UCI数据集,以下是一些常用的数据集:
1. Iris 数据集: 包含了三个不同种类的鸢尾花的花萼和花瓣的大小数据。
2. Wine 数据集: 包含了不同品种的葡萄酒的化学分析数据。
3. Breast Cancer 数据集: 包含了乳腺肿瘤患者的一些特征数据。
4. Seeds 数据集: 包含了三种不同种类的小麦种子的不同形态特征。
5. Heart Disease 数据集: 包含了心脏病患者的一些生理指标和症状数据。
这些数据集都是经过处理和标准化的,适合用于聚类分析的实验。当然,在实际应用中,你也可以根据自己的需要选择其他的数据集。