深度学习与计算社交科学:从LIWC到文化计量学

需积分: 10 0 下载量 145 浏览量 更新于2024-07-16 收藏 4.48MB PDF 举报
"这份资料是清华大学刘知远老师在2018年关于深度学习与计算社交科学的演讲PPT,涵盖了深度学习在理解和分析社会现象,尤其是通过语言和社会心理学的角度,如何应用到自然语言处理和社交媒体分析中的内容。" 深度学习是人工智能领域的一个重要分支,它主要利用神经网络模型来解决复杂的学习任务,如图像识别、语音识别和自然语言处理。在计算社交科学中,深度学习被用来挖掘和理解人类社会的行为模式,通过对大量文本数据的分析,揭示社会现象背后的语言特征和心理状态。 社交科学,包括社会语言学和社会心理学,关注人类社会行为的研究。社会语言学研究语言如何反映和影响社会结构,而社会心理学则探索人们如何在社会环境中相互作用。例如,Linguistic Inquiry and Word Count (LIWC) 是一种工具,通过分析语言使用来洞察个体的心理状态和情绪,这在社交媒体分析中非常有用。 计算社交科学(Computational Social Sciences)利用大数据和计算方法来研究人类文化和社会现象。一个著名的例子是哈佛团队对1800年至2000年间500万本Google Books的关键词频率统计,这种方法被称为"文化计量学",可以观察历史时期的文化变迁。此外,Google Book N-grams提供了查看书籍中特定词汇或短语随时间变化的工具,这对于文化趋势的研究极其宝贵。 基于关键词的计算社交科学研究也日益活跃。例如,Jure Leskovec在斯坦福大学的工作,他收集了9000万个博客并追踪了网络流行语(memes)的传播。这样的研究可以帮助我们理解信息如何在网络中传播,以及它们如何影响公众观点。另一个例子是Cristian Danescu-Niculescu-Mizil在康奈尔大学的研究,他分析了在线社区用户随着时间推移的语言风格变化,揭示了用户生命周期和社区内语言演进的规律。 这些研究展示了深度学习和自然语言处理技术在社交媒体分析中的应用,它们不仅能够揭示个体的心理状态,还能够描绘出整个社会群体的行为模式和文化变迁。通过深入挖掘和理解这些数据,我们可以更好地预测社会动态,设计更有效的信息传播策略,并对人类行为有更深刻的洞察。