知识图谱和知识图谱和Neo4j浅析浅析
在当前大数据行业中, 随着算法的升级, 特别是机器学习的加入,“找规律”式的算法所带来的“红利”正在逐渐地消失,进而需
要一种可以对数据进行更深一层挖掘的方式,这种新的方式就是知识图谱。
一.什么是知识图谱
知识图谱(Knowledge Graph)是一种用点来代替实体,用边代替实体之间关系的一种语义网络。通俗来说,知识图谱就是把
所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络,它提供了站在关系的角度去分析问
题的视角。站在这个角度我们可以从“找规律”的维度上升到“理解”的维度, 这也就是为什么有人说知识图谱是 AI 的未来。
“达观数据是一家人工智能公司”这句话在机器看来只不过是一连串的字符, 但是在我们人看来却可以分成主谓宾三部分,即主
语“达观数据”谓语“是”宾语“人工智能公司”。 那么有没有一种数据的组织形式让机器看到这句话时不再是一个字符串, 而是一
个具有类似主谓宾可以“理解”的结构呢?当然,这就是知识图谱要干的事情。
知识图谱可以表示成一个实体关系网络图,实体就是一个包含信息的个体,画出来叫节点;关系是两个实体之间的联系,画出
来叫边。借用上面的例子“达观数据是一家人工智能公司”,“达观数据”和“人工智能公司”就是两个实体,“是”即这两个实体之间
的关系。所以这句话用知识图谱可以表示图1。
图1
二.知识图谱的应用场景
知道了什么是知识图谱,那么知识图谱有什么用处呢?这里我举两个例子:知识图谱在搜索引擎中的作用以及在银行风控系统
中的应用。
1.知识图谱在搜索引擎中的应用
有时候我们在使用搜索引擎时, 我们的搜索词(Query)往往看起来更像是一个问题,比如“张三是从哪里毕业的”,这时我们
需要搜索引擎直接给出我想要的结果,而不是一个网页排名(page rank) 。比如我在 Google 中搜索“扎克伯格的妻子是谁”, 我
需要是扎克伯格的妻子普莉希拉?陈的详细信息而不是一些包含了她信息的网页。我们先看下 Google 的结果:
图2
那么Google是怎么做到的呢?其实早在2012年Google 就已经在搜索中加入了知识图谱,用户可以通过Google 构建的知识图
谱直接查询到结果,这种方式极大地提升了用户体验。而且对于 Google 来说处理起来也比较便捷,首先将“扎克伯格的妻子
是谁” 这个 Query通过自然语言处理技术(NLP)处理成“扎克伯格”实体和”has_wife" 的关系,从已经构建好的知识图谱中查
询, 然后将查询结果返回给用户。
然而就是这样的一个改动,从用户使用的角度来看已经从普通的搜索引擎变成了智能问答的系统,用户体验上升了一个层次。