用node写出计算两个文本之间相似度的代码,第一个文本是中文,第二个文本是html 格式的
时间: 2024-02-29 22:55:14 浏览: 243
好的,我可以为您提供一个示例代码。这个代码使用 Node.js 的 `string-similarity` 模块来计算两个文本之间的相似度,并使用 `cheerio` 模块来从 HTML 格式的文本中提取纯文本。
请注意:这个代码仅供参考,实际使用时需要根据具体需求进行修改。
```javascript
const stringSimilarity = require('string-similarity');
const cheerio = require('cheerio');
const request = require('request');
// 定义要比较的两个文本
const text1 = '这是一段中文文本';
const url = 'https://www.example.com'; // 替换为您要比较的 HTML 页面
// 使用 request 模块获取 HTML 页面内容
request(url, (err, res, body) => {
if (err) {
console.log(err);
return;
}
// 使用 cheerio 模块从 HTML 中提取纯文本
const $ = cheerio.load(body);
const text2 = $('body').text();
// 使用 string-similarity 模块计算相似度
const similarity = stringSimilarity.compareTwoStrings(text1, text2);
console.log(`文本1:${text1}`);
console.log(`文本2:${text2}`);
console.log(`相似度:${similarity}`);
});
```
这个代码会输出两个文本和它们之间的相似度。您可以将其中的 `text1` 和 `url` 替换为您要比较的文本和 HTML 页面。
阅读全文