基于transH的知识图谱嵌入应当如何划分训练集和测试集
时间: 2024-02-03 08:03:46 浏览: 145
知识图谱:基于嵌入的模型(TransE 、TransH、TransR和TransD)
在基于TransH的知识图谱嵌入中,一般将知识图谱中的三元组按照一定的比例划分为训练集和测试集。一般的做法是,将知识图谱中的三元组随机划分为训练集和测试集,其中训练集用于训练模型,测试集用于评估模型的性能。
具体的划分比例可以根据实际情况进行调整,一般来说,训练集占据整个知识图谱的比例要高于测试集,例如可以将知识图谱划分为70%的训练集和30%的测试集。
在划分训练集和测试集时,需要注意保证训练集和测试集中的实体和关系是相互独立的,即测试集中不存在训练集中已经出现过的实体和关系。这是为了保证模型的泛化能力和推广能力,避免出现过拟合或者欠拟合等问题。
在OpenKE中,可以使用TrainDataLoader和TestDataLoader两个类来加载训练集和测试集数据,并进行模型训练和测试。具体的使用方法可以参考OpenKE的官方文档。
阅读全文