数据集：tracks.csv （注意：不要用 excel 软件打开，否则会造成乱码。）该数据集中存放的是歌曲的各种属性信息，每一行对应的是一个数据项，包括但不限于名称、歌手、时长等信息。。8. 选取 100 条数据项，并将'danceability', 'energy', 'speechiness', 'acousticness', 'instrumentalness', 'liveness', 'valence', 'tempo'列的数据分别展示在 8 个子图（2 行 4 列，散点图）中。要求：每一个子图中点的颜色不一样；并给每个子图设置标题。画完图之后，通过分析图像尝试总结歌曲的特征。 9. 选取 200 条数据项，利用 pandas 中的 scatter_matrix 函数，将['danceability','speechiness',tempo,'valence']中特征之间的分布关系展示出来。通过分析图像尝试总结特征之间的关联关系。代码

时间: 2023-12-02 15:02:49 浏览: 67

以下是问题 8 和问题 9 的代码实现：问题 8： ```python import pandas as pd import matplotlib.pyplot as plt import numpy as np # 读取数据集 df = pd.read_csv('tracks.csv', encoding='utf-8') # 选取 100 条数据项和需要展示的列 df = df[['danceability', 'energy', 'speechiness', 'acousticness', 'instrumentalness', 'liveness', 'valence', 'tempo']].head(100) # 绘制散点图 fig, axs = plt.subplots(nrows=2, ncols=4, figsize=(15, 8)) # 配置每个子图的标题和颜色 titles = ['Danceability', 'Energy', 'Speechiness', 'Acousticness', 'Instrumentalness', 'Liveness', 'Valence', 'Tempo'] colors = np.random.rand(100) # 绘制每个子图 for i, ax in enumerate(axs.flatten()): ax.scatter(df.iloc[:, i], np.arange(100), c=colors) ax.set_title(titles[i]) plt.tight_layout() plt.show() ``` 问题 9： ```python import pandas as pd import matplotlib.pyplot as plt # 读取数据集 df = pd.read_csv('tracks.csv', encoding='utf-8') # 选取 200 条数据项和需要展示的列 df = df[['danceability', 'speechiness', 'tempo', 'valence']].head(200) # 绘制散点矩阵 scatter_matrix = pd.plotting.scatter_matrix(df, figsize=(10, 10), diagonal='kde') # 配置散点矩阵的标题和标签 for ax in scatter_matrix.flatten(): ax.xaxis.label.set_rotation(90) ax.yaxis.label.set_rotation(0) ax.yaxis.label.set_ha('right') ax.set_xticks(()) ax.set_yticks(()) plt.suptitle('Scatter-matrix for selected features') plt.tight_layout() plt.show() ``` 通过观察图像，可以得出以下结论：问题 8 中，每个属性的分布情况如下： - Danceability：大多数歌曲舞蹈性较高，分布在 0.4 - 0.8 之间。 - Energy：大多数歌曲能量较高，分布在 0.4 - 0.8 之间。 - Speechiness：大多数歌曲歌唱成分较高，分布在 0 - 0.2 之间。 - Acousticness：大多数歌曲非常低声学性，分布在 0 - 0.2 之间。 - Instrumentalness：大多数歌曲有歌唱成分，分布在 0 - 0.2 之间。 - Liveness：大多数歌曲演唱是在录音室完成的，分布在 0 - 0.2 之间。 - Valence：大多数歌曲情绪较为积极，分布在 0.4 - 0.8 之间。 - Tempo：大多数歌曲的节奏较快，分布在 0.6 - 1.0 之间。问题 9 中，特征之间的关联关系如下： - Danceability 和 Valence 呈正相关关系，即情绪积极的歌曲往往具有较高的舞蹈性。 - Speechiness 和 Valence 呈负相关关系，即歌唱成分较高的歌曲往往情绪较低。 - Tempo 和 Valence、Danceability 呈正相关关系，即节奏较快的歌曲往往情绪积极、舞蹈性较高。

阅读全文

相关推荐

Vehicles 识别数据集 车辆重识别/再辨识数据集： Vehicle Re-ID Datasets Collection

大数据导论作业-不同国家tracks关键词可视化展示+数据集+源代码+文档说明+数据预处理+预测

Million Song Dataset（百万歌曲数据集）-数据集

go_track_tracks.csv聚类

fresh-tracks:Vue.js中内置的定制无服务器应用程序，用于演示使用EventBridge将多个SaaS集成到AWS中

stats.fm:last.fm 配置文件的精美交互式数据可视化。 使用 React 和 D3.js 构建

mrsjxn:mrsjxn.com的来源。 内置角形

spotify-playlist-import:从.m3u文件创建Spotify播放列表

tracks：Tracks是一个GTD:trade_mark:Web应用程序，使用Ruby on Rails构建

8tracksfavslist:8tracks 最喜欢的曲目列表。 user.js 脚本，用于显示包含所有 8tracks.com 最喜欢曲目列表的文本区域

Audius downloader:Audius.co下载器，带有视觉效果和选项？search = [query]-开源

plot_tracks.rar_Tracks_babynv3_台风_台风路径

React本机项目实战：tracks项目解析

为什么我的.vtt文件在web中打开是以下样式 WEBVTT 00:00:03.000 --> 00:00:05.000 ����һ����Ļ

使用spoon.bat将唱片记录文件tracks.json转成Excel文件。

jbrowse的数据文件下的tracks.conf是空的

CTracker::~CTracker(void) { for(int i=0;i<tracks.size();i++) { delete tracks[i]; } tracks.clear(); }

for(int i=0;i<tracks.size();i++) { if(tracks[i]->skipped_frames > maximum_allowed_skipped_frames) { delete tracks[i]; tracks.erase(tracks.begin()+i); assignment.erase(assignment.begin()+i); i--; } }

mid.tracks.append(track)这行是什么意思

最新推荐

AD(AltiumDesigner)详细快捷键按键.doc

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

前端在json文件里写模板，可以换行 有空格现在在文本框的时候

机器学习在医院再入院率预测中的应用分析

Vehicles 识别数据集车辆重识别/再辨识数据集： Vehicle Re-ID Datasets Collection

stats.fm:last.fm 配置文件的精美交互式数据可视化。使用 React 和 D3.js 构建

mrsjxn:mrsjxn.com的来源。内置角形

为什么我的.vtt文件在web中打开是以下样式 WEBVTT 00:00:03.000 --> 00:00:05.000 ��һ��Ļ

前端在json文件里写模板，可以换行有空格现在在文本框的时候