专利摘要文本分割:分类算法的应用与有效性验证
需积分: 10 17 浏览量
更新于2024-08-12
1
收藏 690KB PDF 举报
"基于分类算法的专利摘要文本分割技术 (2012年),作者丁长林、蔡东风、王裴岩,发表于《山东大学学报(理学版)》2012年5月刊,文章编号1671-9352(2012)05-0068-05,DOI:10.6040/j.lssn.1671-9352.2012.05.013,主要研究内容涉及专利摘要的文本分割,利用分类算法解决摘要内容分割问题。"
本文探讨的是在专利摘要处理中的一个重要问题——文本分割。专利摘要是对专利技术核心的精炼表述,对其进行有效的分割有助于更好地理解和定位专利内容。然而,由于专利摘要的特殊性,其长度较短,且不同主题内容之间没有明显的分隔符,使得传统的基于标点符号或固定模式的文本分割方法无法直接应用。
文章提出将专利摘要的分割问题转换为一个句子分类问题。这种方法的核心是将每个句子视为一个独立的单元,然后利用分类算法来判断这些句子是否属于同一主题。分类算法的选择和特征提取对于此问题的解决至关重要。作者可能对比了多种分类算法,如朴素贝叶斯、支持向量机、决策树等,并探讨了不同的特征,比如词性标注、关键词提取、TF-IDF值等,以评估它们在专利摘要分割任务中的性能。
通过实验和分析,作者证明了利用句子分类方法可以有效地对专利摘要进行分割,从而实现更精确的专利内容定位。这一研究对于专利检索、分析和管理具有重要意义,特别是在大规模专利数据处理中,能够提高效率和准确性,有助于专利信息的快速检索和理解。
关键词包括:专利摘要、文本分割、句子单元、分类算法和词性,这些关键词揭示了研究的主要领域和技术手段。根据中图分类号TQ91,我们可以推断这属于科技文献或信息处理技术范畴。
这项研究为处理专利摘要提供了一种创新的解决方案,利用机器学习的分类算法解决了摘要内容分割的挑战,为后续的专利分析和检索工作提供了有力的工具。
2009-06-24 上传
2021-07-08 上传
2021-07-14 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38539018
- 粉丝: 6
- 资源: 941
最新资源
- 俄罗斯RTSD数据集实现交通标志实时检测
- 易语言开发的文件批量改名工具使用Ex_Dui美化界面
- 爱心援助动态网页教程:前端开发实战指南
- 复旦微电子数字电路课件4章同步时序电路详解
- Dylan Manley的编程投资组合登录页面设计介绍
- Python实现H3K4me3与H3K27ac表观遗传标记域长度分析
- 易语言开源播放器项目:简易界面与强大的音频支持
- 介绍rxtx2.2全系统环境下的Java版本使用
- ZStack-CC2530 半开源协议栈使用与安装指南
- 易语言实现的八斗平台与淘宝评论采集软件开发
- Christiano响应式网站项目设计与技术特点
- QT图形框架中QGraphicRectItem的插入与缩放技术
- 组合逻辑电路深入解析与习题教程
- Vue+ECharts实现中国地图3D展示与交互功能
- MiSTer_MAME_SCRIPTS:自动下载MAME与HBMAME脚本指南
- 前端技术精髓:构建响应式盆栽展示网站