CAIL2018数据集介绍
时间: 2023-10-27 13:07:38 浏览: 229
CAIL2019中国法律智能技术评测数据集.rar
CAIL2018是中国法研杯的一个子任务,是一个面向法律领域的中文智能问答数据集。该数据集共包含两个子任务:案例检索和问答。其中案例检索子任务涵盖了民事、刑事、行政、知识产权等多个领域,共包含了21,014篇法律文书。问答子任务则包含了3,000个与案例检索相关的法律问题和对应的答案。
该数据集的特点是:1)面向法律领域,具有一定的专业性;2)问题和答案都是中文文本,难度较高;3)涉及多个领域,覆盖广泛;4)问题和答案之间有较强的相关性,需要进行上下文理解。
该数据集可以用于智能问答系统、文本匹配等任务的研究和评测。同时,该数据集也为法律领域的自然语言处理提供了一个基准测试集。
阅读全文