介绍一下LITTI数据集
时间: 2023-10-28 16:06:33 浏览: 33
LITTI(The Ludwigsburg-Tübingen Corpus of spoken German)是一个德语口语数据集,包含了德国路德维希堡和图宾根两个城市的不同年龄、性别、职业、社会背景的母语德语人士的口语录音。该数据集由斯图加特大学和图宾根大学的语言学家们在2009年至2011年间收集完成,总共包含了从不同社交场合、不同语境下的自然对话、独白、朗读等口语数据,涵盖了各种口语表现形式和复杂度。
LITTI数据集的语音数据采集于不同设备,包含了16位、24位、32位采样深度,44.1kHz、48kHz、96kHz采样率的音频文件,同时还包含了说话人的基本信息、录音环境等元数据。该数据集的规模达到了33.4小时,共包含了165个参与者的口语数据,是研究德语口语特征和语音识别的重要资源。