首页word2vec elasticsearch

word2vec elasticsearch

时间: 2024-07-13 18:01:28 浏览: 141

mtianyanSearch:Word2vec 个性化搜索实现 +Scrapy2.3.0(爬取数据) + ElasticSearch7.9.1(存储数据并提供对外Restful API) + Django3.1.1 搜索

Word2vec 个性化搜索实现 +Scrapy2.3.0(爬取数据) + ElasticSearch7.9.1(存储数据并提供对外Restful API) + Django3.1.1 搜索本仓库为搜索端网站端代码，爬虫端请前往获取可用功能: 知乎答案问题爬虫存入ElasticSearch 全文搜索(需结合网站端一起使用)，搜索词高亮标红 Redis实现的实时三站已爬取数目展示，热门搜索Top-5 word2vec改变ElasticSearch(function_score, script_score)评分，比如历史上你搜索过Apple，会使得Apple经过 Word2vec 计算出的苹果，乔布斯等关键词打分排名靠前 word2vec 模型训练全过程请查看FunpySpiderSearchEngine项目Word2VecModel 中README word2vec 使用，影响El

Word2Vec是一种流行的自然语言处理技术，它通过将词语转换成固定维度的向量（通常是实数），来捕捉词汇之间的语义和上下文关系。这种方法通常采用神经网络模型，如连续词袋模型（CBOW）或Skip-gram模型来进行训练。 Elasticsearch是一个开源的搜索引擎，主要用于全文搜索和分析。它可以集成Word2Vec生成的词向量，用于提升查询效果。比如，可以将Word2Vec得到的词向量作为用户的搜索关键词或文档内容的一部分存储到Elasticsearch的索引中。这样，当用户输入查询时，Elasticsearch能够利用相似度计算找出最相关的文档，即使查询中的单词并非精确匹配，也能找到相关含义的近义词。整合方法通常是先训练Word2Vec模型，然后在Elasticsearch的索引模板中指定如何将词向量与文档关联，并在查询阶段利用向量化算法（例如BM25+余弦相似度）进行相关性排序。

阅读全文