小数据集上使用卷积神经网络的巴厘字符识别的多增强技术

124 浏览量更新于2023-12-09 收藏 1022KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 7（2021）521www.elsevier.com/locate/icteMAT-AGCA：使用卷积神经网络的小数据集上的巴厘字符识别的多增强技术Ni Putu Sutramiania，b，Nanik Suciatia，Nana，Daniel Siahaanaa印度尼西亚泗水，Institute Teknologi Sepuluh Nopalan，智能电气和信息技术学院，信息学系b印度尼西亚巴东Udayana大学工程学院信息技术系接收日期：2020年11月24日;接收日期：2021年3月22日;接受日期：2021年4月21日2021年4月30日在线提供摘要lontar手稿是一个古老的巴厘岛文化遗产，使用棕榈叶上的巴厘岛字符书写。在lontar中识别巴厘岛字符具有挑战性，因为它具有噪声和有限的数据可用性。为了解决这些问题，需要进行数据扩充以增加数据的种类和数量，从而提高识别性能。在这项研究中，我们收集了巴厘岛字符图像，50个lontar手稿作家。我们提出了MAT-AGCA，结合自适应高斯采样和卷积自动编码器的数据增强。基于InceptionResnetV2，DenseNet169，ResNet152V2，VGG19和MobileNetV2的实验，我们提出的方法取得了最佳性能，准确率为96.29%c2021韩国通信和信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。关键词：巴厘文字;Lontar手稿;数据增强;自适应高斯滤波;卷积自动编码器1. 介绍巴厘岛的文字来源于古印度的婆罗米文字。巴厘岛字符包括Wianjana，Suara，Pengangge和Gempelan。巴厘岛的所有地区都可以找到巴厘岛字符，从街道名称，办公室路标和lontar手稿开始。隆塔手稿是一种古老的巴厘岛文化遗产，使用巴厘岛字符写在棕榈叶上。隆塔尔在巴厘岛的宗教生活中有着密切的关系。前人已经尝试开发巴厘文字识别系统，但在识别lontar手稿中的巴厘文字时仍然存在一些问题。在这项研究中，我们专注于提出一种增强方法，适用于一组手写图像的数量有限，高变化的笔画和噪声，以提高识别性能的巴厘岛字符。隆塔手稿是用Pengrupak写在干棕榈叶上的，Pengrupak是一种专门用于书写巴厘岛字符的小刀。Pengrupak的使用导致∗ 通讯作者。电子邮件地址： nanik@if.its.ac.id（N. Suciati）。同行评审由韩国通信和信息科学研究所（KICS）负责https://doi.org/10.1016/j.icte.2021.04.005巴厘文字的书写是不一致的，有各种各样的书写变化。棕榈叶的使用也很有影响力，因为棕榈叶有纤维或烛果烟灰的痕迹，以区分棕榈叶的字符。在字符识别中，噪声成为影响识别结果的重要因素。降噪技术在巴厘岛文字与背景的分离中起着重要的作用。在对龙塔手写体上的巴厘文字符进行识别时，龙塔叶纤维会成为噪声，影响识别过程。此外，在巴厘字符数据集中仍然存在有限的变化来处理书写在lontar手稿中的巴厘字符的变化，因此需要增强技术来提供书写变化。物体识别的研究已经在各个领域进行。以前的研究将深度学习应用于文化对象识别[1，2]。Satheesh和Raj [3]提出了多核模糊C均值（MKFCM）和混合分类器，使用提名分类方法将图像区分为空洞TB和粟粒TB。对巴厘语和爪哇语字符进行了相关的字符识别研究。Darma [4]提出了巴厘岛字符识别的Zoning和k-最近邻。Sugianela和Suciati进行了相关研究[5]。2405-9595/2021韩国通信和信息科学研究所（KICS）。出版社：Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521522通过将方向梯度直方图应用于爪哇字符的识别。Ramteke等人。[6]提出了一种使用支持向量机和自适应布谷鸟搜索（SVM-ACS）算法对马拉地语文本文档进行光学字符识别和分类的方法。Prasetyo等人进行了相关研究。[7]通过在Milkfish眼睛分类中提出余弦K最近邻。该方法使用最近的加权方案，其中权重不再单独从最近邻居获得，而是通过涉及所有最近邻居对来获得。这些研究没有应用预处理技术作为数据增强来提高识别性能。在这项研究中，我们使用Palabangan lontar手稿，并收集了巴厘岛的50个lontar手稿作家我们有助于这个研究课题，提出了一种方法，对lontar手稿的巴厘字符的数据增强。在这项工作中，我们的研究旨在克服有限的巴厘字符数据集识别巴厘字符的lontar手稿提出MAT-AGCA作为一种数据增强技术。MAT-AGCA可以产生新的巴厘岛字符图像综合更好的图像质量作为新的数据集，即手写巴厘岛字符的lontar（HBCL）数据集作为一个解决方案，为有限数量的巴厘岛字符。我们开发摘要提出了一种基于卷积神经网络的图像分类模型，用于识别长卷手稿图像中的巴厘文字，这是目前图像识别的最佳方法。本文的结构如下：第2节讨论文献综述及相关著作。第三部分描述了隆塔手稿上的巴厘文字符，并提出了我们提出的方法，使用MAT-AGCA的巴厘文字符识别的数据增强。第四部分是实验研究和讨论的结果。最后，第5节提出了结论和未来的工作。2. 文献综述数据扩充可以提供数据变化和规模提升数据集以提高识别性能。预处理技术可用于通过提高图像质量来增加数据变化。在巴厘字符识别中，lontar手写体具有在字符识别之前需要减少的噪声。各种研究应用了各种预处理方法来提高图像质量。Dnyandeo和Nipanikar [8]将自适应阈值技术应用于车牌识别。本研究使用四种自适应阈值技术，即，均值、中值、高斯滤波器和积分图像。研究讨论了自适应阈值在光照和分辨率问题中的重要性。Darma和Sutramiani [9]使用CIELab基于颜色空间对巴厘字符进行预处理。Sudarma和Sutramiani [10]对巴厘文字进行了相关的预处理研究在纸莎草纸上由Pramuntal等人提出的关于图像质量增强的相关研究。[11]是通过提出一种灰度共生矩阵（GLCM）特征提取，采用对比度自适应颜色校正技术（NCACC）的反向传播神经网络（BPNN）对水下鱼类进行分类。在医学图像的情况下，Reddy等人。[12]提出了对CT和MR图像的集成引导非线性各向异性滤波。另一种可用于降低噪声的预处理技术是自动编码器。Gondara [13]曾经使用卷积自动编码器对医学图像进行去噪。Ke等人[14]提出了一种基于深度卷积神经网络（E2 E-DCNN）的端到端自动图像注释模型，该模型通过基于原始图像生成新图像。Li和Yeh [15]采用了相同的技术来处理数据限制和变化的问题。各种研究已经应用预处理技术来提高图像质量。然而，他们没有使用预处理技术来提高图像识别性能。一些研究人员已经将深度学习应用于各种字符识别。Rabby等人。[16]使用CNN检查了孟加拉语手写字符的识别。本研究仅识别基本字符、数字、修饰语和孟加拉语组合字符。Sonawane和Shelke [17]使用Alexnet应用迁移学习来识别梵文手写字符。Pragathi等人[18]使用ConcolutionalNeural Network来识别手写泰米尔字符。Elleuch等人进行了相关的研究。[19]提出了一种新的基于SVM的CNN架构设计，并使用Dropout进行阿拉伯字符识别。他们解释了一种新的探索模型，重点是集成两个分类器，即CNN和SVM，用于识别离线阿拉伯手写体（OAHR）。在汉字识别的情况下，Gan 等人。[20]比较了递归神经网络（ RNN ）和卷积神经网络 1-D 用于在线手写汉字（OLHCCR）数据集识别。相关研究已由Zhang et al.[21]通过提出Resnet和基于中心损失的度量学习的组合来提高识别的准确性。迁移学习是一种广泛应用于提高识别性能的技术。各种研究将迁移学习应用于各种物体的识别。Shallu和Mehra [22]通过检查训练测试数据大小对网络性能的影响，提出了一种使用VGG16，VGG19和ResNet50进行乳腺癌分类的迁移学习方法。 Falconi 等人 [23] 应用MobileNet、Nasnet、InceptionV3和Resnet50对乳房X线摄影图像中的异常进行分类，以确定每个模型的性能。Swasono等人。[24]将预先训练的模型应用于分类，消灭烟叶害虫。该研究使用VGG16模型1500张烟草图片Vaka提出的相关研究等人[25]提出了具有支持值的深度神经网络（DNNS），以产生更好质量的图像并固定其他性能参数并评估效率和性能。Hanif和Bilal [26]提出了一种用于图像分类的竞争残差网络（CoRN）。所提出的网络由具有两个相同块的残差单元组成，每个块包含卷积滤波器、批量归一化和最大输出单元，以使得能够在卷积滤波器之间进行竞争并降低卷积层的维数N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521523×=Fig. 1. 巴厘岛龙塔形象。3. 方法图二. 巴厘岛特色。导致叶纤维在采集过程中成为噪声，我们提出了一种新的多增强技术，使用自适应高斯采样和卷积自动编码器（MAT-AGCA）的组合，以克服数据集中的数据量有限的数据增强。该方法可以通过降低原始图像中的噪声来提供数据变化，以提高识别性能。图3显示了我们提出的方法。第一阶段是MAT-AGCA，它有两个子过程，即AGT和CAE。该阶段使用原始数据集作为输入，通过结合MAT-AGCA和原始数据集来产生Lontar的手写巴厘语字符（HBCL）数据集。第二阶段是使用CNN生成模型的训练过程。在这个阶段，我们应用了三个预训练的模型来练习识别模型。第三阶段是巴厘字符识别过程，测试识别性能。以下是本研究的材料和方法3.1. 隆塔手稿巴厘文字是巴厘岛用来书写文化手稿的古老文字。巴厘岛字符包括18类称为Wianjana字符。隆塔手稿是由干棕榈叶制成的。隆塔手稿上的巴厘文字是用一把叫做Pengrupak的刀写的。刀笔形成巴厘岛字符，然后着色巴厘岛特色。巴厘岛文字的有限变异是识别巴厘岛文字的挑战。巴厘岛的文字有不一致和不同的书写形式。因此，我们从50位巴厘岛的龙塔手稿作家那里收集了巴厘语字符，以丰富变体。我们将此数据集用作数据增强过程的基础，以提高识别性能。图1显示了本研究中使用的lontar手稿。我们使用扫描仪获得了lontar手稿上巴厘文字的图像。然后，我们将每个巴厘岛字符的图像切割成48 48像素的大小。这个过程产生了1195个巴厘字符的图像作为原始数据集。例如，图像采集的结果可以在图中看到。二、3.2. 多增强技术-自适应高斯卷积自动编码器（MAT-AGCA）本文提出了一种结合自适应高斯滤波和卷积自动编码的数据增强技术。MAT-AGCA应用AGT和CAE通过提高图像质量来增加数据集中的数据变化。自适应高斯滤波是一种使用高斯滤波器的自适应阈值技术，取决于标准偏差的值。在一维中，高斯函数为：用的是蜡烛粉图 1显示巴厘岛文化由棕榈叶制成的手稿。巴厘文化手稿中的巴厘文字具有独特的特点G（x， y）12πσ（1）2 2σ2因为这是用Pengrupak手抓伤的结果。它导致不一致的字符形状，比纸或其他介质上的手写字符更难识别，例如图2中的Ra字符。用蜡粉作为着色剂给隆塔尔手稿带来了噪声，因此在识别过程中成为一个挑战。例如，图2中的Da示出了由蜡烛粉引起的噪声。此外，用棕榈叶该滤波器用于去除图像中的高频分量。σ是标准差和中心（x，y）处的像素，其中x是确定阈值结果的高斯函数，y是具有平方根的常数负一。该处理使用图2所示的输入图像，该输入图像是来自图像获取结果的原始图像。图图5（a）示出了高斯滤波器的结果。窗口大小是影响输出质量的参数N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521524××× × × ××图3.第三章。提出的方法：多增强技术-自适应高斯卷积自动编码器（MAT-AGCA）。图像来自AGT实验进行了不同的窗口大小：3 3， 5 5， 77， 11 11，和13 13。手写的巴厘岛字符根据作者有各种书写风格。在lontar上识别手写的巴厘文字是一个挑战。隆塔手稿是使用Pengrupak书写的，因此导致巴厘岛的字符书写变得多样化。因此，为了能够识别在lontar中发现的巴厘岛字符的变化，需要特定的技术来提供数据集的变化。此外，原始数据集的局限性和类之间脚本的相似性成为一个令人兴奋的挑战，因此有必要进行数据变异技术。我们使用卷积自动编码器（CAE）产生巴厘岛字符的变化，在原始数据。这种技术用于克服巴厘字符图像中有限数量的数据变化。CAE通常具有与经典自动编码器相同的步骤，但神经网络编码器和解码器模型使用CNN。例如，在编码器部分，特征向量生成过程与普通的CNN模型相同。编码器卷积层的末端然后被平坦化以产生特征向量。CAE在解码器部分有差异。在将特征向量重新排列为2D之后，需要上采样或转置卷积技术来进行去卷积处理。与经典的自动编码器相比，CAE更好地用于图像处理，因为它利用卷积神经网络的全部功能来利用图像结构[13]。图4显示了本研究中使用的CAE架构。输入图像的大小为4848，输出具有一样的尺寸。黄线表示产生特征的卷积过程。在编码器阶段，输入数据通过3个卷积层（Conv2D）和3个池化层（MaxPooling2D）。在卷积层，我们使用3 3内核来帮助组织网络，在一个大的感受野上有分解。绿线是从产生相同大小的输出图像的特征解卷积的。去卷积过程使用上采样技术。我们应用具有不同时期变化的CAE，例如50、100和150个时期，以产生最佳增强结果。3.3. 实验情景CNN是一种有效用于图像处理的人工神经网络。CNN是一种人工神经网络架构，它通过额外的层结构来替代隐藏层。卷积层使用一个小的加权内核来产生视觉特征[20]。CNN需要很长时间，这取决于用于形成模型的数据量。处理的数据越多，所需的时间就越长。为了缩短训练时间，我们使用了使用预训练模型的迁移学习技术。除了缩短训练时间外，预训练模型还可以提高准确性和模型性能。我们从古代lontar手稿和50位lontar作家中收集了巴厘文字数据。50 lontar作家旨在提供巴厘岛字符的写作风格的变化。基于这个编译过程，我们构建了一个数据集，的巴厘岛字符总数为1197字符组成，十八节课。在实验场景中，我们执行五个场景。第一个场景使用数据集而不应用增强。第二种方案通过使用旋转、高度偏移和宽度偏移变换来应用几何变换（GT）。第三种情况应用卷积自动编码器来向数据集添加变化。第四个sce- nario应用自适应高斯滤波保持到数据集，以通过减少噪声来提高图像质量。第五sce- nario应用我们提出的方法进行增强。我们N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521525××× × ××见图4。卷积自动编码器架构。图五、M A T - A G C A 的增强结果：（a）AGT和（b）CAE。表1实验场景。场景数据集中的图像数量数据分布培训验证测试无扩增1197945144108几何变换31592835216108卷积自动编码器31592835216108自适应高斯阈值31592835216108该方法31592835216108使用五个 CNN 预训练模型，即 InceptionResnetV2 ，DenseNet169，ResNet152V2，VGG19和MobileNetV2来测试每个场景下的识别性能。表1显示了本研究的实验场景4. 结果和讨论4.1. 数据增强在第一个场景中，我们没有应用数据增强到数据集。我们使用此数据集作为确定在每个场景中应用数据增强的影响的基础。未经增强的数据集由1197张巴厘岛字符图像组成，这些图像由古代lontar手稿和50位lontar作家组成。该数据集由18个巴厘岛字符类组成。第二个场景应用几何变换作为数据扩充技术。我们使用三种变换，即旋转、宽度移位和高度移位。几何变换应用于第一种情况中使用的数据集。基于增强过程，第二种情况下的总数据我们在第三个场景中实现了CAE，到数据集。CAE有卷积和反卷积过程，每个过程由3个卷积层组成，核大小为33.我们实现了3种不同时期的CAE，即50，100和150。在本实验中，CAE的最佳结果是在100个epoch中获得的。AGT应用于第四种情况。该预处理技术用于通过减少图像中的噪声来提高图像质量。AGT增强结果受窗口大小的影响。我们使用不同的窗口大小：3 三，五五、七七、十一11和13 13得到最好的增强效果。在最后一个场景中，我们实现了我们提出的方法。MAT-AGCA从CAE的风格变化和AGT的图像质量增强我们N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521526×× × × ××提出了MAT-AGCA增强数据集作为一个新的巴厘岛字符数据集，称为手写巴厘岛字符的 Lontar Mandarpt（HBCL）。4.2. 使用InceptionResNetV2进行我们使用InceptionResNetV2进行了第一次测试。在没有增强的数据集中，InceptionResNetV2产生了54.7%的训练准确率，21.2%的验证和测试准确率。这表明，由于数据量小，该模型是过拟合。此外，我们应用几何变换作为数据增强与三个操作，即。旋转，宽度和高度移动，可以将性能提高10.2%。在这种情况下，我们还应用了卷积自动编码器，自适应高斯阈值和我们提出的方法。实验结果表明，在这种情况下，CAE和AGT的性能分别提高了28.8%和39.9%。我们提出的方法提高了61.2%的性能与82.4%的测试准确率。4.3. 使用DenseNet169进行在第二个测试中，我们使用DenseNet169作为预训练模型。我们基于实验场景测试了五种类型的数据集，以确定我们所提出的方法的性能。在没有增强的数据集中，模型显示过拟合，因为训练和验证之间存在40%的差距。在使用几何变换、CAE、AGT和我们提出的方法进行数据增强后，我们提出的方法获得了最佳模型，性能提高了50.9%，测试准确率为90.7%。4.4. 使用ResNet152V2进行在第三个测试中，我们使用ResNet152V2作为预训练模型。在没有增强的数据集中，该模型对108个巴厘字符图像的测试准确率为44.4%。结果表明，该模型只能识别不到一半的测试数据。在应用包括我们提出的方法在内的四种数据增强后，模型产生了更好的性能，测试准确率为95.3%。这些结果表明，我们提出的方法将ResNet152V2模型的性能提高了50.9%。与几何变换、CAE和AGT相比，模型的性能提高4.5. 使用VGG19进行我们使用VGG19作为第四次测试的预训练模型。在四种类型的增强技术上产生的模型显示出不同的性能改进。几何变换产生了9.2%的性能改进。CAE显示了一个更好的模型，提高了28.7%，AGT提高了模型4.6. 使用MobileNetV2进行我们还应用了MobileNetV2，的参数。该场景旨在确定我们提出的方法在具有少量参数的预训练模型上的性能。结果表明，我们提出的方法可以提高模型的性能比几何变换，CAE和AGT的55.5%。我们提出的方法仍然能够使用具有少量参数的预训练模型在小数据集上提供改进的模型性能。4.7. 模型性能比较在实验中发现，MAT-AGCA在数据增强中的应用受到影响数据增强结果质量的历元和窗口大小变化参数的影响。我们应用了不同数量的时期变化，例如50、100和150个时期，窗口大小变化例如3 3、 5 5、 7 7、 11 11和1313，以产生最佳增强结果。在巴厘岛字符的情况下，最好的增强图像质量是使用100个历元和7 - 7的窗口大小图6显示了使用五个预训练模型的MAT-AGCA的性能基于使用四种增强技术和五种预训练模型的实验结果，我们提出的方法可以产生更好的模型性能。实验是使用RMSProp优化器进行的，学习率为0.00001，softmax激活150个epochs。在使用前述方法的实验中，仍有几个巴厘字符未能被识别，如图7所示。这是由于隆塔手稿中的巴厘文字特征，这已在第3节中描述。例如，有一个破碎的模式，在Nya字符造成错误的识别图所示。7（b）.我们提出的方法，MAT-AGCA可以解决这个问题，通过增加数据的种类，同时提高图像质量在第二种情况下，我们应用了[27结果表明，我们提出的方法产生更好的性能的情况下，巴厘岛字符的模型性能提高了55.5%。对于龙塔手稿中的巴厘文字，由于其与其他文字有着不同的特点，应用增广几何变换并不能产生出代表巴厘文字书写特点的新的文字图像。在第三种情况下，添加数据变量实现了[31- 33 ]中使用CAE仅通过使用卷积网络重建图像图案来提供变化CAE基于各种书写风格生成新的图像，而不增加图像质量，因此生成的图像无法代表具有噪声的lontar手稿中的巴厘字符图像的特征。与CAE相比，我们提出的方法在五个预训练模型上的平均模型性能提高了17.5%。的N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521527图第六章 MAT-AGCA性能：（a）InceptionResNetV 2，（b）DenseNet 169，（c）ResNet 152 V2，（d）VGG 19，（e）MobileNetV 2。图第七章上一个方法识别字符失败：（a）sa字符，（b）nya字符，（c）da字符，（d）ba字符。在[8，34]中，通过提供基于降噪的数据变化，AGT作为数据增强的应用产生了85.3%的五个预训练模型的平均性能。AGT可以提供比几何变换和CAE更好的模型性能，因为它产生具有降噪的增强图像。与AGT相比，我们提出的方法可以产生更好的性能，最高的测试准确率可达96.2%。表2显示了性能比较我们提出的方法和使用五种CNN架构的其他研究。实验结果表明，该方法具有较好的识别性能，适用于巴厘岛汉字的识别.实验结果表明，基于降噪和风格变化的MAT-AGCA数据增强我们提出的方法可以在VGG19上产生更好的性能，N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521528表2五个CNN预训练模型的性能比较预训练模型增强增广方法几何变换[27[31- 33 ]第十三话自适应高斯阈值[8，34]该方法火车54.70%60.10%73.26%92.26%91.88%InceptionResNetV2Val21.29%33.33%50.00%61.11%82.40%ACC21.29%31.48%50.00%61.11%82.40%火车百分之九十八点八百分之九十三点四三84.23%百分之九十四点四二百分之九十五点九四DenseNet169Val39.81%61.11%63.88%88.88%90.74%ACC39.81%57.40%63.88%88.88%90.74%火车百分之九十七点八四百分之九十三点八二百分之九十八点七三百分百百分之九十九点六八ResNet152V2Val44.44%50.92%73.61%百分之九十七点二二百分之九十五点三七ACC44.44%50.92%78.70%90.74%百分之九十五点三七火车百分百百分之九十九点一五百分百百分之九十九点八五九十九点八二VGG19Val61.11%67.59%89.81%百分之九十三点五一90.74%ACC61.11%百分之七十点三七89.81%百分之九十三点五一百分之九十六点二九火车53.33%75.76%百分之九十九点三六百分之九十八点八七百分之九十九点六一MobileNetV2Val41.66%48.14%88.88%百分之九十三点五一百分之九十六点二九ACC40.74%54.62%90.74%百分之九十二点五九百分之九十六点二九有大量的参数和MobileNetV2，一些参数。5. 结论和今后的工作在本文中，我们提出了MAT-AGCA作为数据扩充，以克服在有限的数据集上的识别问题。我们提出了一个解决方案，以克服噪音问题的巴厘岛字符图像在隆塔手稿。该方法可以降低噪声，并提供图像变化，以提高识别性能。传统的增强仅通过应用几何变换（如旋转和缩放）提供数据变化，而不减少噪声。我们提出的方法可以减少噪声，因此，它可以通过丰富数据集上的图像变化来提高识别精度。通过对5个预训练模型的5次实验，MAT-AGCA算法取得了最好的性能，准确率为96.29%，优于现有的增强方法。通过应用MAT-AGCA，五个预训练模型的平均识别准确率提高了50.7%。在这项研究中，我们使用MAT-AGCA产生的手写巴厘岛字符的隆塔（HBCL）数据集。HBCL数据集是通过图像质量增强和代表Lontar手稿上各种手写风格的变化，从巴厘字符图像的增强结果中编译而成的。该数据集由18类文种组成，以文种为主体，不包括甘吞甘文和甘普兰文。作为未来的工作，我们希望开发一种新的架构利用巴厘文的特定读句规则识别甘吞甘文和根佩兰文，从而实现对整个巴厘文的识别。仍然需要具体的方法来克服阅读巴厘岛字符仍然存在的挑战。CRediT作者贡献声明Ni Putu Sutramiani：研究的概念和设计，数据采集，数据分析和/或解释，写作-原始草案，写作-审查编辑。Nanik Suciati：研究的概念和设计，数据采集，数据分析和/或解释，撰写-原始草案，撰写-审查编辑。DanielSiahaan：研究的概念和设计，数据的获取，数据的分析和/或解释，写作-原始草案，写作-审查编辑。竞合利益作者声明，他们没有已知的可能影响本文所报告工作致谢该研究得到了印度尼西亚共和国国家研究和创新机构的支持，资助号为3/E1/KP.PTNBH/2021。引用[1] 法医Hatir，M. 巴尔斯图格兰岛stecInce，基于深度学习的历史石碑风化Heritage（2020）http://dx.doi.org/10.1016/j.culher.2020.04.008.[2] C.辛塔斯湾Lucena，J.M.富埃尔特斯角Delrieux，P. Navarro，R.González-José，M. Molinos，基于深度卷积网络的伊比利亚陶瓷J·邪教Heritage 41（2020 ）106 http://dx.doi.org/10.1016/j.culher。2019.06.005。[3] K.G. Satheesh，A.N.J. Raj，使用MKFCM和混合分类器的医学图像分割和分类， Int. J. Intell. 工程系统10 （ 6 ）（ 2017 ）9http://dx.doi.org/10.22266/ijies2017.1231.02[4] I.W.A. S Darma，Zoning和K-最近邻在手写体字符识别中的实现，Lontar Komput 。： J. Ilmiah Teknol. Inf. 10 （ 1 ）（ 2019 ） 9 ，N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521529http://dx.doi.org/10.24843/lkjiti.2019.v10。i01.p02。N.P. Sutramiani，N.Suciati和D.SiahaanICT Express 7（2021）521530[5] Y. Sugianela ， N. Suciati ， Ekstraksi fitur pada pegenalan karakteraksara jawa berbasis histogram of oriented gradient，JUTI：J. IlmiahTeknol. Inf.（2019）http://dx.doi.org/10.12962/j24068535.v17i1.a819.[6] S.P. Ramteke，A.A. Gurjar，D.S. Deshmukh，A streamlined OCRsystem for handwriting MARATHI text document classification andrecognition using SVM-ACS algorithm ， Int. J. Intell. 工程系统 11（3）（2018）186http://dx.doi.org/10.22266/IJIES2018.0630.20[7] E.普拉塞约河普尔巴宁佳斯河Adityo，余弦K-最近邻在遮鱼眼睛分类中，Int.J.Intell.Eng.Syst.13（3）（2020）11http://dx.doi.org/10.22266/ijies2020.0630.02[8] S.V. Dnyandeo，P.R.S. Nipanikar，自适应阈值技术用于车辆牌照识别的综述，Int. J. Adv. Res. Comput. Commun. 5（4）（2016）944http://dx.doi.org/10。17148/IJARCCE.2016.54232。[9] I.W.A. S Darma，N.P. Sutramiani，使用投影轮廓对lontar手稿上的巴厘语脚本进行分割，在：2019年第5届新媒体研究国际会议，2020年，pp.212http://dx.doi。org/10.1109/conmedia46929.2019.8981860.[10] M. Sudarma，N. Putu Sutramiani，细化张孙应用方法在纸莎草纸上的巴厘文字图像中的应用，国际J。Appl. 91（1 ）（2014 ）9http://dx.doi.org/10.5120/15844-4726[11] R.A. Pramounts，S. P.I. Wibirama Santosa，P.N. Andono，文学硕士苏文，海洋环境下鱼类分类的图像增强技术，中国海洋科学出版社，2001。Eng.Syst.12（5）（2019）116http://dx.doi.org/10.22266/ijies2019.1031.12[12] M.G. P.V.N. Reddy Reddy，P.R. Reddy，使用集成引导非线性各向异性滤波与图像统计的医学图像融合，Int. J. Intell。Eng.Syst.13（1）（2020）25 http://dx.doi.org/10。22266/ijies2020.0229.03。[13] L. Gondara，使用卷积去噪自动编码器的医学图像去噪，在：IEEE数据挖掘研讨会国际会议，ICDMW，IEEE，2016年，pp. 241http://dx.doi.org/10。1109/ICDMW.2016.0041，arXiv：1608.04667。[14] X. Ke，J. Zou，Y. Niu，基于深度CNN和多标签数据增强的端到端自动图像标注，IEEE Trans. Multimed。21（8）（2019）2093http://dx.doi.org/10.1109/TMM。2019.2895511。[15] Y. X.李慧云Yeh，基于卷积自动编码器和卷积神经网络的图像分类半监督学习模型，在：Proceedings - 2019 International Symposiumon Intelligent Signal Processing and Communication Systems ，ISPACS2019，2019，pp.1http://dx.doi.org/10.1109/ISPACS48206.2019。8986255[16] A.K. Azad Rabby，S.哈克，S。Abujar，S.A. Hossain，Ekushnet：使用卷积神经网络进行孟加拉语手写识别，Procedia Comput。Sci.143（2018）603http://dx.doi.org/10.1016/[17] P.K. Sonawane，S. Shelke，Handwritten devanagari character classi-fication using deep learning，in ：2018 International Conference onInformation ， Communication ， Engineering and Technology ，ICICET2018，IEEE，2018，pp.1http://dx.doi.org/10.1109/ICICET.2018。8533703。[18] M.A. Pragathi ， K. Priyadarshini ， S. Saveetha ，A.S. Banu ， K.O.Mo- hammed Aarif，使用深度学习的手写泰米尔字符识别，在：Proceedings - International Conference on Vision To- wards EmergingTrends in Communication and Networking，ViTECoN 2019，IEEE，2019，pp. 1 http://dx.doi.org/10.1109/ViTECoN.2019。8899614。[19] M.埃勒乌赫河 Maalej，M. Kherallah，一种基于SVM的CNN分类器架构的新设计，用于离线阿拉伯语手写识别， ProcediaComput。Sci.80（2016）1712http://dx.doi.org/10.1016/j.procs.2016.05.512[20] J. Gan，W. Wang，K. Lu，A new perspective：Recognizing onlinehandwriter Chinese characters via 1-dimensional CNN， Inform. Sci.478（2019）375http://dx.doi.org/10.1016/j.ins.2018.11.035[21] R.张，智-地Wang，Y.陆，基于resnet和中心丢失的手写体汉字识别度量学习的组合，in ： Proceedings of the InternationalConference on Document Analysis and Recognition ， Vol. 5 ，ICDAR，2018，pp. 25http://dx.doi.org/[22] 沙卢河Mehra，乳腺癌组织学图像分类：从头开始训练还是迁移学习？ICTExpress4（4）（2018）247http://dx.doi.org/10.1016/j.icte.2018.10.007[23] L.G. Falconi，M. Perez，W.G. Aguilar，使用mobilenet和nasnet进行乳房乳房X线摄影异常分类的迁移学习

下载后可阅读完整内容，剩余1页未读，立即下载