中文字体识别数据集下载
时间: 2023-09-15 18:15:05 浏览: 278
以下是几个常用的中文字体识别数据集,您可以根据自己的需求进行下载:
1. CASIA-HWDB:中国科学院自动化研究所中文手写数据库,包含3755个汉字,100种不同的字体,每种字体10个不同的大小和位置,共计37550个样本。下载链接:http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html
2. ICDAR 2011:国际文本检测和识别竞赛(ICDAR) 2011比赛中使用的汉字字体数据集,包含3500个汉字,50种不同的字体,每种字体70个不同的大小和位置,共计245000个样本。下载链接:https://rrc.cvc.uab.es/?ch=8&com=downloads
3. USTB-CHS:北京科技大学汉字字体数据集,包含4000个汉字,20种不同的字体,每种字体200个不同的大小和位置,共计80000个样本。下载链接:http://www.nlpr.ia.ac.cn/databases/download/feature_data/USTB_CHS_DB1.0.rar
4. HCL2000:华中科技大学汉字字体数据集,包含3755个汉字,50种不同的字体,每种字体75个不同的大小和位置,共计140625个样本。下载链接:http://www.nlpr.ia.ac.cn/databases/download/feature_data/HCL2000.rar
这些数据集均为免费开放的,可以在相关网站进行下载。如果您需要更多的数据集,可以在论文或相关比赛网站上查找。
阅读全文