Rasa NLU组件升级:复合实体识别新特性
需积分: 9 159 浏览量
更新于2024-12-01
收藏 9KB ZIP 举报
资源摘要信息:"Rasa NLU是用于自然语言理解的库,主要用于理解用户输入的意图和实体。在处理自然语言的过程中,实体抽取是一个重要的步骤,它可以识别文本中的关键信息,如人名、地点、时间等。在一些复杂的情况下,一个实体可能由多个子实体组成,这时候就需要使用复合实体(Composite Entities)进行识别。
Rasa NLU的复合实体组件“rasa_composite_entities”就是为了处理这种复杂的实体抽取情况而设计的。该组件允许开发人员定义一些规则,以便将相关的子实体组合成一个更大的实体。这样一来,当一个复合实体被正确识别时,系统能够提供更丰富的上下文信息,从而更准确地理解用户的意图。
在2021年1月13日的更新中,该组件针对Rasa 2.x版本进行了优化。旧的数据加载逻辑被移除,现在加载模式的唯一方法是通过外部JSON文件。这样的改变提高了组件的灵活性和可配置性,允许开发者更自由地定义复合实体。同时,提取器的命名也发生了变化,从“composite”变为了“CompositeEntityExtractor”,使得组件的命名更加符合Python的命名规范。
在此之前,2020年2月26日的更新中,为了防止其他实体提取器(例如小鸭提取器)在处理过程中出现问题,对实体的分类方式进行了调整。实体现在由它们的起始位置(start值)进行分类,这样可以保证实体的顺序不会被其他提取器影响,从而确保提取结果的准确性和一致性。
另外一个值得注意的更新是在2020年1月10日,那时组件的输出格式发生了变化,子实体不再在“contained_entities”键下查找,而是位于新的“value”键下。这个更新使得复合实体提取器的输出与其他提取器保持一致,对开发者来说更加友好。
安装方面,用户可以通过pip包管理器直接安装“rasa_composite_entities”,具体命令为“pip install rasa_com”。
需要注意的是,该组件是用Python编写的,因此它适用于以Python为主要开发语言的项目。该组件是开源的,并且提供了一个名为“rasa_composite_entities-master”的压缩包子文件,供开发者下载和使用。"
2021-10-10 上传
2022-01-29 上传
2021-02-03 上传
点击了解资源详情
2021-03-28 上传
2021-05-10 上传
2018-07-06 上传
2020-05-08 上传
2021-04-12 上传
Mia不大听话
- 粉丝: 21
- 资源: 4592
最新资源
- CCOmPort,CRC32的c语言源码实现,c语言程序
- csanim:就像manim,但用于计算机科学!
- QT 编写的编译器,高亮显示,显示行号,一般编辑器的功能,代码填充
- Devopslearning
- react-project
- 大气扁平家居设计网站模板
- 家居装饰公司网站模板
- Raspi-rfid-temp
- cksc2.0,c语言中代码源码都是啥意思,c语言程序
- 串口调试助手 小程序 工具
- DeliverIt-documentation
- NginxAccess_AutoConfig:动态IPAddress进行Nginx访问配置(白名单)
- RegDiff:查找两个Windows注册表状态之间的差异-开源
- LiScEig 1.0:用于常规 Sturm-Liouville 问题的 MATLAB 应用程序。-matlab开发
- Myportforio1
- Proyecto-R-Face:R-Face Project是用Python编写的软件,利用Opencv库进行人脸识别