Tomas Mikolov的Penn Treebank研究与简单实例

下载需积分: 0 | ZIP格式 | 30.77MB | 更新于2024-10-29 | 58 浏览量 | 举报

1 收藏

资源摘要信息:"Penn Treebank (宾州树库) 是由 Tomas Mikolov 在2010至2012年间开发的一个资源库，主要用于自然语言处理（NLP）和计算语言学领域。Tomas Mikolov 是一位在语言模型和自然语言处理方面有着深厚研究的科学家，尤其在循环神经网络语言模型（RNNLM）领域贡献显著。宾州树库最初是基于宾夕法尼亚大学开发的，包含了大量的结构化语言数据，这些数据来源于华尔街日报、莎士比亚戏剧等来源的文本。这些数据经过精确的手工标注，不仅包含了词汇信息，还包含了语法结构，如词性标注（POS tagging）和句法结构解析（Parsing），对于研究者而言，是理解语言结构和开发语言模型的宝贵资源。宾州树库在语言模型和自然语言处理的众多研究中扮演着关键角色。它被广泛用于训练统计语言模型和构建神经网络语言模型，以实现机器翻译、文本摘要、语音识别、问答系统等多种应用。Mikolov 的研究使得语言模型的训练更高效，他的作品，包括宾州树库，极大地推动了自然语言处理技术的发展。 Tomas Mikolov 的研究经常发表在诸如《语言模型》（Language Modeling）等专业领域内的重要期刊和会议上。他的工作不仅限于宾州树库，还包括了其他一些重要的语言模型和算法，如 Word2Vec。通过这些研究，Mikolov 对整个计算语言学和人工智能领域产生了深远的影响。宾州树库的官方网站是 ***，在这里可以找到宾州树库的下载链接以及相关的研究成果。虽然该资源库不再更新，但它仍是当代自然语言处理研究的基石之一。研究者们通过简单例子（simple-examples）这样的压缩文件可以快速入门，并利用这些数据进一步展开他们的研究工作。"

资源目录

收起资源包目录

Tomas Mikolov的Penn Treebank研究与简单实例（62个子文件）

README 609B

ptb.char.test.txt 864KB

test.sh 2KB

README 211B

train.sh 2KB

test.sh 957B

AMI-3E0501_u3005_128490_129032.lat.gz 257KB

example.output 2KB

README 167B

swb.rnn.model 53.96MB

ptb.test.txt 439KB

latlist 190B

AMI-3E0501_u3005_127513_127835.lat.gz 773KB

train.sh 2KB

train.sh 3KB

getbest 6KB

ptb.valid.txt 390KB

README 1KB

train 330KB

README 96B

FAQ.txt 8KB

README 1013B

train.sh 3KB

ptb.char.train.txt 9.57MB

train.sh 2KB

rnnlmlib.h 6KB

ptb.train.txt 4.87MB

test.sh 920B

train.sh 3KB

README 335B

makenbest.c 426B

train.sh 2KB

README 452B

README 551B

gettext 6KB

AMI-3E0501_u3005_127865_128175.lat.gz 1.27MB

train.sh 2KB

README 368B

AMI-3E0501_u3005_128188_128447.lat.gz 76KB

test.sh 920B

makenbest 6KB

nbest.sh 177B

test.sh 1KB

prob.c 745B

rnnlmlib.cpp 49KB

ptb.char.valid.txt 768KB

makefile 411B

gettext.c 552B

convert.c 885B

rnnlm.cpp 14KB

getbest.c 1KB

README 3KB

test.sh 3KB

test 34KB

test.sh 3KB

valid 29KB

AMI-3E0501_u3005_127040_127488.lat.gz 443KB

test.sh 2KB

example.sh 813B

CHANGE.log 1KB

swb.ngram.model 19.12MB

共 62 条

Ann'sBlog

粉丝: 2614
资源: 4

Tomas Mikolov的Penn Treebank研究与简单实例

Penn Tree Bank (PTB)数据集

PTB文本数据集.zip

PTB(Penn Treebank Dataset)文本数据集

Penn Tree Bank(PTB文本数据集）

PTB(Penn Tree Bank)小型语料库

Penn Treebank POS Tag Set详解

基于Penn Treebank的未词法化PCFG学习方法

PennToPCFG:从 Penn Treebank 学习未词法化的 PCFG

swda:带有 Penn Treebank 链接的 Switchboard Dialog Act 语料库

ptb-reader-rust：合并的Penn Treebank格式的简单解析

最新资源