Bilibili冷战视频数据分析:发布时间、时长及观看趋势

需积分: 11 15 下载量 51 浏览量 更新于2024-08-05 2 收藏 622KB DOCX 举报
本资源是一份关于"Python数据分析与应用"的课程结业论文,聚焦于对Bilibili(B站)上的冷战相关视频进行深度数据分析。研究者使用Python作为主要工具,结合pandas、numpy等库进行数据处理和分析。源数据来源于B站爬取的csv文件,包含了视频名称、发布日期、视频时长、观看量、弹幕数以及视频风格等字段,共计50个与冷战相关的视频。 首先,论文通过导入必要的数据分析库如matplotlib和seaborn来进行数据可视化。作者在数据处理阶段,将'发布时间'列提取到年份,以便于后续分析。分析内容分为四个部分: 1. 冷战相关视频的发布时间分布:结果显示,大部分视频发布于2020年,反映了疫情期间人们居家时间增加,对冷战历史的关注度上升。2015年及之前的视频较少,反映出国际形势的变化影响了观众的兴趣。 2. 视频时长分布:大部分视频的时长集中在10分钟至30分钟之间,显示出用户更倾向于观看短视频,可能是因为短时、易于消化的内容更符合现代用户的浏览习惯。 3. 观看量与弹幕数分析:通过多个可视化图表,发现“苏联”和“新冷战”相关话题的视频观看量和弹幕数较高,而较长时长(30分钟和1小时)的视频更能吸引观众互动。弹幕数随视频时长增加先增后减,表明观众的参与度与视频长度存在关系。 4. 视频风格分布:社科人文类视频占据了主导地位,其次是人文历史和手书类,这可能反映了观众对于冷战话题的偏好,他们更倾向于社科和历史类型的内容。 最后,论文总结指出,随着国际形势的发展,人们对冷战话题的关注度提升,同时短视频形式和特定主题的视频内容受到观众的喜爱。这份报告不仅提供了数据驱动的见解,也为理解网络社区中的历史兴趣和文化趋势提供了有价值的信息。