Tagasaurus：帮助手动标记和创建图像集的工具

100 浏览量更新于2024-01-25 收藏 714KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

软件影响10（2021）100157原始软件出版物Tagasaurus，一个帮助手动图像标记和创建图像集的工具Alexander V.Mantzarisa，R.S.，Randyll Pandohiea，Michael Hopwooda，Patrick Phoa，Dustin Ehlingba统计和数据科学系，中佛罗里达大学，4000 University Blvd，Orlando，FL 32816-2370，USAb独立研究和开发自动清洁装置保留字：图像注释标签数据输入生活博客认知紧张A B标准本文介绍了Tagasaurus的一个工具，帮助手动注释图像集和创建带注释的图像集合。界面所允许的工作流程的一个关键方面是，它记录独立的情感值关联、图像关联和文本注释。这个版本通过允许用户在实体标签下创建图像集合而超越了以前的方法。这可以帮助在特定标签下创建图像语料库，机器学习模型需要该语料库来训练图像场景中的对象代码元数据当前代码版本v0.01用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2021-126可复制胶囊法律代码许可证MIT许可证使用git的代码版本控制系统使用JavaScript、NodeJS、Electron、HTML、CSS的软件代码语言、工具和服务编译要求、操作环境依赖性跨平台桌面操作系统; Linux、Windows和MacOS 如果可用，链接到开发人员文档/手册https://github.com/mantzaris/Tagasaurus/blob/main/README.md问题支持电子邮件alexander. ucf.edu1. 导言和说明数码摄影使主流消费者能够捕捉他们生活经历的许多图像，并将其存储起来，以便日后欣赏这些记忆。这些照片可以在用户计算机上的文件夹中手动组织，这样的应用程序允许用户更容易地基于按日期/时间排序的图像来搜索他们的照片，并将手动输入的注释（作为Meta数据）与照片相关联。这种应用程序的好处是，用户不需要为注释保留单独的文件，因为应用程序空间包含所有注释。对于大型图像集，这个过程可能需要相当长的时间，并产生认知压力或疲劳[2]，使用户在一段时间后不愿进行注释。*通讯作者。图像注释的另一个越来越重要的应用是用于机器学习图像分类器的训练，其中分类器需要产生图像的描述，例如[3]。在这篇参考文献中，不仅是一般的对象标签检测的目标，而且是人类表达情感的丰富描述。这项工作提供了对挑战的深入了解，甚至可以获得用于模型训练的人类基准。在复杂模型需要大量训练数据的情况下，人工人为因素的瓶颈变得明显，因为它耗时且通常昂贵。生活博客在知识工程中的潜力在[4]的早期工作中已经被注意到Tagasaurus是一个应用程序，旨在满足希望手动注释大型图像集并输入3种不同类型信息的用户的需求。这三种类型是文字描述、一组电子邮件地址：alexander.mantzaris@ ucf.edu（A. V. Mantzaris），randyll.pandohie@ knights.ucf.edu（R. Pandohie），michael. knights.ucf.edu（M.Hopwood），phuong. ucf.edu（P. Pho），dustinehling16@gmail.com（D. Ehling）。https://doi.org/10.1016/j.simpa.2021.100157接收日期：2021年9月24日;接受日期：2021年10月1日2665-9638/©2021作者。由Elsevier B.V.出版。这是一篇开放获取的文章，使用CC BY许可证（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表软件影响杂志首页：www.journals.elsevier.com/software-impactsA.V. 曼萨里斯河Pandohie，M.Hopwood等人软件影响10（2021）1001572Fig. 1. 该图像显示了使用Tagasaurus标记单个图像时用户界面的示例屏幕截图。用情感来诠释图像的部分，图像关联（迷因）和文本描述可以与所产生的标签一起被看到。从这里，用户还可以导入更多图像或删除图像。（主要由用户Vlad Fonsark从https://www.pexels.com产生的图像）。图二. 左上角显示实体集合唯一名称的标记、表示集合的图片，左下角显示带有文本的情感值描述和相关的图像（模因）可通过分页选项卡。用户可以在中心看到图像集合，并能够重置图像或包括更多图片（图片由用户Vlad Fonsark从https://www.pexels.com制作）。情感值和一组图像关联（模因[5]）。在这里，情绪与表情符号在Facebook等流行的社交媒体平台上的应用方式不同[6]。这里，可以以使人联想到在合成器上使用机械刻度盘的方式来校准值，如稍后所解释的，这为图像标签感知的情感聚类提供了帮助。对于每个文本描述，生成一组标签（关键字）以帮助对图像内容进行分类。用户还能够创建“实体”，这些实体是特定集合标签名称下的图像集合。一个集合有一个代表性的图像，一组属于同一类别的图像，一个产生标签的文本描述，相关的图像（模因）和一组情感值。在用户标记图像并创建集合之后，可以使用一个功能将注释数据导出为JSON以及使用的图像2. 用途和影响图1显示了用户在标记（注释）图像时看到的屏幕截图。他们可以访问情绪值控件，这些控件是滑块小部件，可以用于关联（模因）的图像列表以及在编写文本后产生标签的文本描述框。用户还可以加载新的图像和删除与之关联的注释对象的图像。主图像是一个画廊，带有按顺序滑动图像集的控件图2显示为实体生成的用户图像集合的UI的屏幕截图。每个集合实体都有一个唯一的名称和一个代表性的图像。代表性图像不需要对该实体是唯一的，因为图像可以包含多个关注对象。情感、图像A.V. 曼萨里斯河Pandohie，M.Hopwood等人软件影响10（2021）1001573图三. 该图显示了在发布的Tagasaurus v0.01下的数据模型关联示例。节点代表��图像，��集合是实体，它们之间有双向箭头。节点之间的虚线箭头作为模因基于从情感值推断的聚类标签来对节点着色。在界面视图的单个组件中提供关联（迷因）和文本描述，其中选项卡允许用户选择信息。主面板显示实体的图像集合，可以选择新图像或添加更多图像。用户可以创建新的实体集合，删除一个，或者使用顶部的按钮在它们之间循环。扁平界面的设计目的是将模糊性降到最低，或者引入学习曲线，以便不同的注释者可以学习其他注释者的工作。这些信息可用于训练机器学习模型，以了解图像特征、标签和情感之间的关联。这在未来也可以用于预测图像关联（模因）。3. 模型与实现在[7]中介绍了图像标记组件的对象建模，在这里，实体集合在图像注释对象之上创建了一个层。这允许表示将公共元素封装在一组先验独立图像中。图 3显示数据模型的表示形式。节点表示实体和图像的集合，其中应用的颜色来自从其情感值推断的聚类标签实线表示成员关系，虚线表示标签成员关系重叠，点划线表示图像关联（模因）。可以看出，可以产生一个二分网络，使得成员资格的遍历需要两种类型的节点，并且集群编号的模式当数据有限时，其他边可以用于聚合来自其他节点的信息。竞合利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作确认作者要感谢Mark Collins博士在关于创建实体集合时的用户工作流程的讨论中提供的见解。引用[1]A. Myka，诺基亚生活博客 - 走向真正的个人多媒体信息系统，载：移动数据银行和信息系统研讨会， C i t e s e e r ， 2 0 0 5 年，第 1 0 0 页。21-30[2] A. Faiola，P. Srinivas，S. Hillier，改善患者安全：将数据可视化和通信集成到ICU工作流程中以减少认知负荷，载于：医疗保健中的人为因素和人体工程学国际研讨会论文集，第4卷，SAGE出版物Sage India：新德里，印度，2015年，第100页。55比61[3] A. Gatt，M. Tanti，A. Muscat，P. Paggio，R.A. 法鲁贾角 Borg，K.P. Camilleri，M.罗斯纳湖Van der Plas， Face2text：Collecting an annotated image descriptioncorpus for the generation of rich face descriptions，2018，arXiv preprintarXiv：1803.03827.[4] E. Hartnell-Young，F. Vetere，Lifeblog：移动学习的新概念？ IEEEInternationalWorkshop on Wireless and Mobile Technologies in Education （ WMTE'05 ），IEEE，2005，pp. 5页。[5] K.M. Miltner，互联网模因，在：社交媒体的SAGE手册，第55卷，2018年，pp. 412-428[6] J. - H.公园，S- I.金，六个表情符号的新适应Facebook，J。数字。汇合14（9）（2016）417-422.[7] 曼察里斯河 Pandohie ， M. Hopwood ， P. Pho ， D. Ehling ， T.G. 沃克，介绍tagasaurus，一种方法，以减少认知疲劳，从长期的界面使用时，存储描述和印象从照片，技术9（3）（2021）45。

下载后可阅读完整内容，剩余1页未读，立即下载