D:/youtube_video_data/US_video_data_numbers.csv
时间: 2024-10-23 16:11:11 浏览: 24
您提到的CSV文件包含了美国YouTube视频的相关数据,包括观看次数(views)、喜欢次数(likes)、不喜欢次数(dislikes)以及评论总数(comment_total)。要对这些数据进行操作,我们可以按照以下步骤进行:
1. 加载数据到numpy数组:
```python
us_file_path = "./US_video_data_numbers.csv"
t1 = np.loadtxt(us_file_path, delimiter=",", dtype="int", unpack=False)
print("美国视频数据:")
print(t1)
```
这将加载整个列并作为一个二维数组显示。
对于英国的视频数据(`./GB_video_data_numbers.csv`),您已经选择了喜欢数小于等于50万的视频,提取了评论数(`t_uk_comment`)和喜欢数(`t_uk_like`)来进行评论与喜欢数关系的可视化:
```python
uk_file_path = "./GB_video_data_numbers.csv"
t_uk = np.loadtxt(uk_file_path, delimiter=",", dtype="int")
# 过滤喜欢数小于等于50万的视频
t_uk = t_uk[t_uk[:, 1] <= 500000]
# 提取评论数和喜欢数
t_uk_comment = t_uk[:, -1] # 喜欢数列的最后一位是评论数
t_uk_like = t_uk[:, 1] # 第二位是喜欢数
# 绘制散点图
plt.figure(figsize=(20, 8), dpi=80)
plt.scatter(t_uk_like, t_uk_comment)
plt.title('英国视频的评论数与喜欢数关系')
plt.xlabel('喜欢数')
plt.ylabel('评论数')
plt.show()
```
这个图展示了英国YouTube上视频的评论数与喜欢数之间的关系。通过观察散点图,可以分析两者之间是否存在某种趋势或关联性。请注意,具体解读结果需根据实际数据分布来进行。
阅读全文