规则与统计驱动的Web突发事件新闻高效多层分类法
需积分: 9 193 浏览量
更新于2024-08-12
收藏 323KB PDF 举报
本文主要探讨了"基于规则与统计的Web突发事件新闻多层次分类"这一主题,发表于2012年的《计算机应用》期刊,作者是夏华林和张仰森,来自北京信息科技大学计算机学院。面对互联网上Web新闻的指数增长速度以及突发事件新闻的快速传播特性,传统的文本分类方法在准确性与效率方面存在局限,难以高效定位特定主题的突发事件新闻。
作者们针对这些问题,提出了一个创新的方法,即结合规则和统计的两层分类模型。首先,他们通过提取类别关键词来构建规则库,这是一种结构化的处理方式,可以根据预先设定的规则对新闻进行初步分类。这种方法有助于捕捉突发事件新闻的典型特征,提高分类的针对性。
接着,他们采用朴素贝叶斯分类算法对四大类突发事件新闻进行进一步细化。朴素贝叶斯分类是一种基于概率统计的机器学习方法,它假设特征之间相互独立,从而简化了分类过程。这种方法能够根据大量已知数据的学习,提高分类的精确度。
实验结果显示,基于规则与统计的多层次分类方法在准确率和召回率上均达到了90%以上,这表明其在处理大规模Web突发事件新闻时表现出色,分类效率显著优于传统方法。这种分类模型对于实时监控和管理网络上的突发事件新闻具有重要意义,尤其是在新闻传播速度极快、信息量巨大的今天。
关键词包括"规则"、"统计"、"突发事件新闻"和"多层次分类",这些词汇突出了论文的核心技术路线和研究重点。论文的中图分类号为TP181,文献标志码为A,表明这是一篇具有实用价值的工程技术研究论文。
这篇文章不仅介绍了新的分类技术,还提供了实际应用中的有效性证据,对于理解和改进Web突发事件新闻的自动化处理有着重要的理论和实践价值。
2019-08-16 上传
2021-07-14 上传
1098 浏览量
971 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38739942
- 粉丝: 5
- 资源: 954
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜