js如何提取字符串中出现的高频词语
时间: 2023-12-06 13:39:34 浏览: 143
PHP函数实现从一个文本字符串中提取关键字的方法
可以通过以下步骤来提取字符串中出现的高频词语:
1. 将字符串转换成单词列表,可以使用 JavaScript 的 `split` 函数,将字符串按照空格或其他分隔符分割成单词。
2. 创建一个对象,用于存储每个单词出现的次数,可以使用 JavaScript 的对象字面量 `{}`。
3. 遍历单词列表,对于每个单词在对象中增加对应的计数器。
4. 将对象转换成数组,使用 JavaScript 的 `Object.entries` 函数将对象转换成一个二维数组,其中第一维是键值对数组。
5. 根据计数器降序排序,使用 JavaScript 的 `sort` 函数,根据对象的值降序排序。
6. 获取前几个高频词语,根据需要选择前几个出现次数最多的单词。
以下是示例代码:
```
function getTopWords(str, n) {
const words = str.split(' ');
const count = {};
words.forEach(word => {
if (count[word]) {
count[word]++;
} else {
count[word] = 1;
}
});
const entries = Object.entries(count);
entries.sort((a, b) => b[1] - a[1]);
return entries.slice(0, n).map(entry => entry[0]);
}
const str = 'Hello world, this is a test. Hello again.';
const topWords = getTopWords(str, 2);
console.log(topWords); // ['Hello', 'world,']
```
在上面的示例中,`getTopWords` 函数接受一个字符串和一个整数参数,返回出现次数最多的前 n 个单词。该函数首先将字符串分割成单词列表,然后遍历单词列表,统计每个单词出现的次数,最后将计数器转换成数组,并按照出现次数降序排序,返回前 n 个单词。
阅读全文