首页介绍一下LITTI数据集

介绍一下LITTI数据集

时间: 2023-10-28 16:06:33 浏览: 33

LITTI（The Ludwigsburg-Tübingen Corpus of spoken German）是一个德语口语数据集，包含了德国路德维希堡和图宾根两个城市的不同年龄、性别、职业、社会背景的母语德语人士的口语录音。该数据集由斯图加特大学和图宾根大学的语言学家们在2009年至2011年间收集完成，总共包含了从不同社交场合、不同语境下的自然对话、独白、朗读等口语数据，涵盖了各种口语表现形式和复杂度。 LITTI数据集的语音数据采集于不同设备，包含了16位、24位、32位采样深度，44.1kHz、48kHz、96kHz采样率的音频文件，同时还包含了说话人的基本信息、录音环境等元数据。该数据集的规模达到了33.4小时，共包含了165个参与者的口语数据，是研究德语口语特征和语音识别的重要资源。