【文本信息抽取与结构化】详聊文本的结构化【下】【文本信息抽取与结构化】详聊文本的结构化【下】
常常在想,自然语言处理到底在做的是一件什么样的事情?到目前为止,我所接触到的NLP其实都是在做一件事情,即将自然将自然
语言转化为一种计算机能够理解的形式语言转化为一种计算机能够理解的形式。这一点在知识图谱、信息抽取、文本摘要这些任务中格外明显。不同的任务的差异在
于目标的转化形式不一样,因而不同的任务难度、处理方式存在差异。
这个系列文章【文本信息抽取与结构化文本信息抽取与结构化】,在自然语言处理中是非常有用和有难度的技术,是文本处理与知识提取不可或缺的
技术。
本篇介绍如何从非结构的文档中,提取想要的信息,进而结构化文本。
作者&编辑 | 小Dream哥
前述
文本的结构化,是对文本的理解的过程,如果能够将这个过程交给AI去做,能够释放大量的人工成本。在【文本信息抽取与结
构化】详聊文本的结构化【上】中,笔者介绍了文本结构化的意义,并开始介绍了如何进行文本的结构化,介绍了如何定义文如何定义文
本结构化的具体需求本结构化的具体需求以及进行文本的预处理文本的预处理。
这篇我们继续介绍,经过文本的预处理的之后,得到了一个层次丰富、信息准确的JSON字典。我们下一步要做的就是,按照按照
需求,根据这个需求,根据这个JSON字典,抽取出来我们想要的信息字典,抽取出来我们想要的信息。
评论0