清华大学刘知远社会计算讲义:表示学习与深度学习方法

5星 · 超过95%的资源 需积分: 10 39 下载量 70 浏览量 更新于2024-07-18 2 收藏 9.95MB PDF 举报
"清华大学刘知远老师的社会计算与表示学习讲义" 这篇讲义涵盖了社会计算和表示学习的多个重要主题,这些主题在深度学习(DL)领域内具有广泛的影响力。以下是讲义中涉及的主要知识点: 1. **词向量表示(word2vec)**:词向量是自然语言处理中的关键概念,它将词语转化为连续的向量空间表示,使得语义相似的词在空间上接近。词2Vec是实现这一目标的算法之一,包括CBOW(Continuous Bag of Words)和Skip-gram两种模型,通过预测上下文或单词来学习词向量。 2. **图神经网络(GNN, Graph Neural Networks)**:GNN是一种处理图数据的深度学习模型,可以学习节点、边和整个图的表示。在讲义中可能讨论了如何将神经网络应用于非欧几里得数据结构,如社交网络或化学分子结构。 3. **随机游走(DeepWalk)**:DeepWalk是基于随机游走的方法,通过模拟节点在图上的随机行走生成一系列短路径,然后用这些路径来学习节点的向量表示,类似于词2Vec对文本序列的处理。 4. **LINE(Linear Iterative Neighbourhood Embedding)**:LINE是一种优化图表示学习的算法,旨在保持一阶和二阶邻接性,即近邻节点和相似节点在嵌入空间中应保持相近。 5. **node2vec**:node2vec是更灵活的随机游走策略,通过调整两个参数控制探索新区域和深度优先搜索的平衡,从而获得更丰富的节点表示。 6. **社会计算**:这部分可能探讨了如何运用机器学习和数据挖掘技术分析社会网络中的行为、关系和模式,例如用户互动、信息传播和社区检测。 讲义可能还涉及了其他高级主题,如图卷积网络(Graph Convolutional Networks, GCNs)、图注意力网络(Graph Attention Networks, GATs)以及在社会计算中使用的其他表示学习方法。这些技术在理解复杂网络结构、预测网络动态和解决现实世界问题方面都有广泛应用。 通过学习这些内容,学生能够掌握处理复杂网络数据的现代方法,并能应用到社交网络分析、信息推荐系统、网络社区检测等实际场景中。