首页请用python3编写程序，它可以实现对一个大容量英文文献进行分词与分句，并且能够对该文献内容的全文单词位置进行检索。更具体地，对于一个含有以分隔符（逗号“,”、空格“ ”、分号“;”、英文句号“.”

请用python3编写程序，它可以实现对一个大容量英文文献进行分词与分句，并且能够对该文献内容的全文单词位置进行检索。更具体地，对于一个含有以分隔符（逗号“,”、空格“ ”、分号“;”、英文句号“.”

时间: 2023-05-03 12:02:49 浏览: 268

采用python程序设计语言，进行分词，再去掉停用词和标点符号等，生成文档的词典

采用python程序设计语言，进行分词，再去掉停用词和标点符号等，生成文档的词典，接着根据词典和文档内容生成词项的倒排记录表（含位置信息），然后根据搜索关键字（多个词项），对文档集进行短语查询，符合检索条件的文档计算余弦相似度，按从大到小的顺序显示，然后进行查询扩展.zip

这个问题需要用Python3编写程序，它可以实现对一个大容量英文文献进行分词与分句，并且能够对该文献内容的全文单词位置进行搜索。此外，对于一个包含以分隔符（逗号、“ ”、分号、“.”、英文句号）隔开的句子的字符串，它还包含有以分隔符（逗号、“ ”、分号、“.”、英文句号）分隔的单词位置。

阅读全文

最新推荐