Relation-Extraction
关系提取 基于对关系的训练实例的表达力的假设的关系提取方法 1.句子级关系提取-(该方法侧重于此建议) 句子级关系提取着重于识别句子中两个实体之间的关系。 使用基于句子的带注释的训练数据,并且该注释包含句子三重对齐信息。 训练集中的句子标有三元组。 训练模型的目标是在给定新实体对的情况下预测新关系。 但是,与这种方法相关的主要缺点是训练数据量不足,因为在现实生活中很难获得标记数据。 2.袋级关系提取 知识图以(头,关系,尾)三元组的形式拥有有关实体之间关系的信息。 这些用于增强标记较弱的训练数据集。 为了创建远程监管数据集(例如NYT),将三元组中的实体对与包含自然文本中头尾实体的句子对齐。 在这种方法中,由实体对匹配的句子构成了一个书包。 这种方法的缺点是这些数据集嘈杂,并且由于实例数在关系中分布不均匀,因此它们是不平衡的。 3.文档级关系提取 句子级关系提取方法没有考虑文档中的实