使用Yelp数据集探索双向链接预测技术

需积分: 12 154 浏览量更新于2024-11-18 收藏 73.64MB ZIP 举报

资源摘要信息:"该项目是一个双向链接预测的课程项目，使用Yelp的Dataset Challenge数据集进行研究，主要预测特定用户会评论哪些餐厅。这个过程涉及到机器学习和网络分析的一些方法，包括随机预测、无监督的随机游走、启发式相似性度量和监督的二进制分类。在这个过程中，使用了一些Python的库，如scikit-learn，networkx和snap.py。" 1. 双向链接预测：这是一个在复杂网络中常见的问题，特别是在用户和产品之间的互动中。在这个项目中，双向链接预测是指预测用户和餐厅之间的互动，即预测用户会评论哪些餐厅。这是一个典型的推荐系统问题，可以应用于各种场景，如预测用户会购买哪些商品，或者预测用户会观看哪些电影等。 2. Yelp数据集：Yelp是一个著名的本地生活服务平台，提供了大量的用户评价、商家信息等数据。Yelp Dataset Challenge是Yelp公司举办的一个数据挑战，提供了一个大规模的数据集，供研究者进行各种研究。在这个项目中，使用了Yelp的Dataset Challenge数据集来进行双向链接预测。 3. scikit-learn：这是一个Python机器学习库，提供了各种机器学习算法，如分类、回归、聚类等。在这个项目中，可能使用了scikit-learn库中的算法来进行监督的二进制分类。 ***workx：这是一个Python图形分析库，提供了各种图形分析的工具，如节点分析、路径分析等。在这个项目中，可能使用了networkx库来分析Yelp数据集中的用户和餐厅的关系。 5. snap.py：这是一个斯坦福大学的网络分析库，提供了处理大规模网络数据的工具。在这个项目中，可能使用了snap.py库来进行无监督的随机游走预测。 6. 随机预测：这是一种简单的预测方法，通过随机选择一些用户或餐厅来进行预测。在这个项目中，random_baseline.py文件可能实现了这种预测方法。 7. 无监督的随机游走：这是一种基于网络结构的预测方法，通过在用户和餐厅的网络中进行随机游走来预测可能的链接。在这个项目中，random_walks.py文件可能实现了这种预测方法。 8. 启发式相似性度量：这是一种基于相似性的预测方法，通过计算用户和餐厅之间的相似性来进行预测。在这个项目中，sameity.py文件可能实现了这种预测方法。 9. 监督的二进制分类：这是一种基于机器学习的预测方法，通过训练一个分类器来预测用户和餐厅之间的链接。在这个项目中，supervised_classifier.py文件可能实现了这种预测方法。 10. 程序运行：在这个项目中，首先需要将Yelp学术数据集放置在数据/提供的数据中，然后运行dataset_maker.py文件生成示例，最后运行dataset_metrics.py、random_baseline.py、random_walks.py、sameity.py和supervised_classifier.py中的任何一个文件进行预测。

收起资源包目录

使用Yelp数据集探索双向链接预测技术（33个子文件）

user.json 53.25MB

random_baseline.py 302B

final_report.pdf 245KB

u_jaccard.json 15.94MB

u_cn.json 6.36MB

util.py 2KB

supervised_random_walks_weights.json 174B

similarity.py 4KB

supervised_classifier.py 2KB

random_walks.py 2KB

b_jaccard.json 13.18MB

examples.json 5.15MB

b_cn.json 5.18MB

u_adamic.json 12.38MB

svd.py 2KB

graph.txt 4.73MB

b_adamic.json 14.92MB

u_jaccard.json 13.22MB

u_adamic.json 14.89MB

examples.json 6.31MB

dataset_maker.py 8KB

README.md 1KB

b_adamic.json 12.41MB

README 42B

eval.py 2KB

business.json 25.13MB

dataset_metrics.py 3KB

b_cn.json 6.35MB

b_jaccard.json 15.89MB

supervised_random_walks.py 6KB

supervised_models.py 7KB

u_cn.json 5.19MB

.gitignore 29B

共 33 条

世界在你心里

粉丝: 27
资源: 4574

使用Yelp数据集探索双向链接预测技术

Bipartite-Reinforcement-Clustering:文本挖掘中的双向增强聚类方法

ggbipart：R语言中用于绘制二分网络图的工具包介绍

O(NM)算法实现的快速C++代码下载_匈牙利算法

faithful-bipartite-rom-reciprocal-tables

Bipartite-Matching

Problem-Solving-using-Bipartite-Graph

d3-bipartite-graph：D3.js中的二分图的Hello World

Bipartite-Reinforcement-Clustering:用于文档学习和机器学习的文本和单词的双向增强聚类，用于文本挖掘

bipartite-test:确定给定图是否为二部图的 Java 程序

mrnai-bipartite-opt:在双向相互作用模型下预测多个RNA最佳相互作用结构的软件

最新资源