图像网格自动滚动显示的研究

157 浏览量更新于2024-01-24 收藏 1.84MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

视觉信息学1（2017）16图像网格显示：自动滚动显示的研究Marco Porta*，Stefania Ricotti意大利帕维亚帕维亚大学电气、计算机和生物医学工程系ar t i cl e i nf o文章历史记录：2017年1月18日在线提供保留字：图像网格显示自动滚动图像展示模式图像集合快速序列视觉呈现a b st ra ct在本文中，我们描述了一个研究的图像网格显示与自动垂直滚动。虽然滚动操作通常由用户手动进行，在RSVP（快速串行视觉呈现）技术的背景下，这项工作考虑了图像网格自动滚动的呈现模式。通过与50名测试人员进行的实验，我们调查了用户的性能，同时寻找特定的目标对象在大型图像集合已经考虑了不同的列数和滚动速度搜索任务意味着点击识别出的目标图片，并简单地说出他们的视觉识别。为了这个目的，并且为了识别可能的特定注视行为，已经利用了眼睛跟踪技术。结果表明，列数和滚动速度确实影响搜索性能。此外，用户的注视往往取决于这两个参数的值而聚焦在不同的虽然不可能明确找到在所有情况下都有效的最佳柱速度组合，但特定的使用环境可以根据需要提出可行的据我们所知，自动滚动的图像网格显示迄今为止从未被研究过2017浙江大学出版社由爱思唯尔公司出版这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍网格（或表格）显示无疑是在屏幕上呈现图像组的最常见方式例如，所谓MS Win-显示中、大和超大图标）或图形工具（例如，在Adobe Photoshop的“样式”调色板中网格的主要优点是显而易见的：由于图像通常是矩形的，它允许有效利用可用空间。它也很直观，因为表格布局用于显示多种数据，也可以显示图片上下文之外的数据图像网格有多种配置，其中图像大小、列数和行数是最常见的变量。当然，图片越小，在屏幕上的显示密度就越高.然而，小的图形表示可能难以识别，特别是当需要识别特定图像或主题时。因此，需要在呈现的图像数量和它们的大小之间进行权衡，这通常取决于诸如呈现目标、主题种类和所需的搜索精度等因素。通讯作者。电子邮件地址：marco. unipv.it（M. Porta）。同行评议由浙江大学和浙江大学出版社负责http://dx.doi.org/10.1016/j.visinf.2017.01.003除非图片数量非常少，否则垂直滚动操作几乎总是必要的。或者，不同的图像集可以显示在单独的“屏幕”中，如有时在网站中发生的那样。然而，特别是在线，加载新屏幕可能会导致较慢的图像浏览体验，这可能并不总是可以接受的。在许多情况下，这两种解决方案的组合（包含可滚动网格的不同屏幕）是一个适当的选择。在本文中，我们考虑一个不寻常的方法，图像网格显示垂直滚动。虽然滚动操作一般由用户手动执行，但在这里，我们关注的是一种呈现模式，在该模式下，网格以恒定的速度自动换句话说，用户不需要使用鼠标或键盘来移动所显示的图像集，所显示的图像集自动地向上移位。这样做的理由是双重的。首先，自动滚动可以被看作是具有恒定滚动速率的手动滚动的模拟。因此，间接地，它是有可能的研究用户行为，同时执行一个最常见的-虽然通常是“无意识的”-在网格显示与许多图像的操作。出于实验目的，对所有测试人员使用相同的速度可以提供更可靠的结果（至少对于我们的调查目标）。我们决定研究滚动图像网格的第二个也是最重要的原因与快速串行视觉呈现（RSVP）模式有关（Spence，2002）。简单来说，RSVP2468- 502 X/©2017浙江大学和浙江大学出版社。由爱思唯尔公司出版这是CC BY-NC-ND许可下的开放获取文章（http：//creativecommons.org/licenses/by-nc-nd/4.0/）上提供。可在ScienceDirect上获得目录列表视觉信息学期刊主页：www.elsevier.com/locate/visinf*M. 波尔塔湾Ricotti/视觉信息学1（2017）1617××意味着在屏幕上快速连续地显示许多图像这种可视化策略的目的是在短时间内呈现虽然在索引图像数据库中，图片具有与它们相关联的文本信息，并且在基于内容的信息检索（CBIR）系统中，图片基于诸如颜色、形状和纹理的固有特征来识别，但是在许多情况下，手动浏览非常大的图像集合事实上，有几种情况下，既没有索引也没有CBIR系统，或者我们只需要选择一些图片，因为它们具有特定的特征，或者仅仅是因为我们用于装饰目的）。使用传统的显示模式浏览大量图像静态网格可能会导致非常无聊的任务，而RSVP可能是正确的解决方案。已经提出了基本RSVP方法的几种变体（其中，单个图片，一次一个，快速地显示在屏幕上）（Cooper等人， 2006年; Porta，2006年，2009年）。例如，在混合呈现模式中，图像以四个或更多个为一组显示;在对角线模式中，图像从屏幕的一个角落移动到相对的一个角落;在拼贴模式中，图片出现在屏幕的随机位置，就像扔在桌子上一样;在火山模式中，图像从屏幕的中心出现并向边缘径向移动;在喷泉模式中，图片随机虽然已经从实验证据中得出了一些一般性指导原则（Witkowski和Spence，2012;Spence和Witkowski，2013），但每个RSVP解决方案都有其自身的特征，需要对其潜力和缺点进行定制调查才能真正理解。据我们所知，自动滚动的图像网格显示迄今为止从未被研究过因此，在本文中，我们专注于这种演示模式，并探讨其可能的用途作为一个RSVP方法。特别是，我们考虑两个主要变量，影响其性能，即列数和滚动速度。虽然图像大小也可能是一个重要因素，但在我们的实验中，我们选择了一个恒定值，以便限制分析的复杂性观察显示的图片的高度，例如，在主要搜索引擎的结果页面中（范围从Bing的约140像素到Yahoo！Google的180）、MSWindows大图标显示（90）或YouTube主页视频缩略图（110、170，包括描述）中，我们可以注意到相对高的可变性。即使我们的选择-为了我们的分析，我们还利用了眼动跟踪技术（Duchowski，2007）。眼动仪是一种能够记录用户在看屏幕时的视线方向的设备眼球运动发生为非常快的扫视，随后是约100-600 ms的注视眼动追踪数据为我们提供了有趣的见解，凝视行为及其与所考虑的变量的关系。总之，本文试图回答关于自动滚动的图像网格显示的Q1当目的是在图像集中找到特定主题时，是否有任何列数和滚动速度的最佳组合来保证问题2：图像搜索的特征是什么特定的凝视行为吗？如果是这样，这些行为是否取决于列数和滚动速度？文章的结构如下。在第二节中，我们描述了一些以前的工作，直接或间接地与网格布局，图像显示和RSVP表示模式。在第3节中，我们说明了我们的研究，在参与者和任务描述。随后，在第4节中，所获得的结果与用户性能、注视行为和注视扫描路径长度相关。最后，在第五节中，我们讨论了所取得的成果，并得出一些结论，也为未来的研究提供了启示。2. 相关工作虽然似乎没有任何研究专门致力于滚动图像网格显示，更不用说调查集中在自动滚动，有工作集中在网格显示的变体，快速串行视觉演示，并使用眼动跟踪作为评估工具或主动控制机制的信息可视化：在这里，我们提供了一些有代表性的例子。PhotoMesa （ ShneidermanandKang ， 2000 ）和 PhotoMesa（Bederson，2001）是基于网格的早期和著名的可视化技术的两个案例第一个是一个照片注释工具，允许用户添加标题和编辑图像，而第二个是一个应用程序，其中多个目录的图像可以在一个可缩放的环境中查看也有人提出了解决方案（ Igarashi 和Hinckley，2000），根据滚动条的速度动态控制网格缩放（滚动条越快，应用的缩放越少）：由于网格显示通常需要滚动，滚动条的小移动可能会产生网格的大位移，如果它包含许多图像。通常，图片也根据某种标准以或多或少的标准网格布置被聚类，使得它们可以以非线性方式被分层浏览或者根据它们的相互相似性被布置例如，Liu等人（2004）分析了用户对网络图像搜索的需求，并提出了一种基于相似性的组织来呈现搜索结果。Ren等人（2009年）描述了一种交互式界面，其中通过无监督的基于图的聚类算法对图像进行聚类。Strong等人（2010）提出了一种支持动态缩放的方法，其中视觉上相似的图像被显示在相同的位置（根据所选择的显示模式，或者分散或者与网格对齐）。Kleiman等人（2015）描述了一种系统，其中图像被动态地布置（在运行中，取决于用户的导航倾向和兴趣）在高维特征空间中靠近它们最近的邻居。在Schaefer（2010）的作品中提出了一种纯网格排列的变体，其中使用基于相似性的图片组织方法将图像显示在用户可以交互的球体同样，Schoeffmann和Ahlström（2012）使用3D界面在圆柱体上显示图像缩略图，基于视觉相似性。至于RSVP方法（其中一些与眼动跟踪有关），Fan et al.（2003）开发了一种用于浏览大量图像的原型解决方案，该解决方案利用了基于凝视的注意力模型。 Oyekoya 和 Stentiford（2006）研究了一个凝视驱动的图像检索系统，并对13名用户进行了测试，这些用户必须在4 × 4屏幕内找到目标图像，当所有注视的持续时间达到阈值时，屏幕会自动改变结果表明，与眼动追踪方法相比，小鼠的反应较慢Corsato等人（2008）比较了四种RSVP技术（浮动，拼贴，火山和拍摄）在特定任务中找到最高数量的图片匹配文本描述，类似于我们的实验。通过眼动跟踪系统对30名参与测试者进行了研究，主要目的是验证视线控制图像选择方法的可行性。除了普通的图片，其他研究18M. 波尔塔湾Ricotti/视觉信息学1（2017）16·+=··×××也考虑过使用RSVP作为浏览或搜索大量数据的手段，如Beck等人。（2012），他使用RSVP来可视化随着时间的推移而演变的图形数据图。在最近的一项工作中，van derCorput和vanWijk（2016）提出了一种系统，该系统提供两种不同的可视化模式，即3. 我们的研究我们进行了125次测试，参与者必须在一组250张随机图像中找到一个特定的目标对象。控制变量是柱数和网格速度。五个目标对象，即火车，飞机，汽车，摩托车和船舶。除了使用眼动追踪技术来研究用户行为外，参与者还在测试期间录制了视频和音频，并被指示用鼠标点击目标图像，并尽快大声说出他们看到了这些图像：这使我们能够将视线位置与选择图像的真实意愿相关联，即使网格移动得太快而无法进行实际鼠标选择。3.1. 参与者50名测试者（28名女性和22名男性）参与了这项研究：其中44人年龄在20至25岁之间，5人在26至30岁之间，1人在40至45岁之间。所有患者视力正常或矫正至正常（11例戴眼镜）。3.2. 任务描述和程序我们创建了五组目标图像，每组由十张图片代表一种交通工具（如前所述，火车，飞机，汽车，摩托车和船）。向每名测试者呈现5个不同的移动图像网格（使用Adobe Flash创建），每个网格具有不同的列数和滚动速度组合，并且包含不同的目标受试者（总共10个目标图像）。对于每个演示，参与者必须找到与上述五个目标集之一相关的目标图片：例如，对测试者的请求可以是“查找描述汽车的图像”每个演示文稿都是由Flash脚本按以下方式生成的图像是从一组3219张普通照片中随机选择的，这些照片是从各种图像集合中提取的，既有公开的（例如MicrosoftOffice剪贴画），也有非公开的。这些照片中没有火车、飞机、汽车、摩托车或轮船;三个参数，即SPEED、COLUMNS和SET，与列数和速度的每种组合相关联，以分别指定列数、速度和目标图像集;每个演示文稿包括250张图片（240张10个目标图像，随机排列）。网格最初从底部进入屏幕，最后从上边缘消失然而，为了避免一些目标对象可能出现在演示的第一部分或最后部分（当屏幕上显示较少的图像时，因为网格开始或结束其运动），在网格的开始和结束处都将n张图片添加到250张图像中，其中n列6（6是填充屏幕的行数）。这些照片是从3219张照片中随机挑选出来的，与之前的240张不同，不包含五个目标对象中的任何一个这样，测试中考虑的实际250张图片总是完全填满屏幕。关于演示速度，网格在Flash帧的每个“执行”时向上移动SPEED像素由于我们使用的帧速率为25 fps，因此实际的演示速度为25 SPEED像素/秒。Flash程序自动计算鼠标点击正确选择的目标图像数量、错误点击的数量（即鼠标点击非目标图像的图像）以及正确选择的目标图像列表每个图像的大小为150 × 150像素，相邻图像之间的垂直和水平间距均为24像素。列数（COLUMNS）可以从3到7. 7是与眼动仪屏幕宽度（1280像素）兼容的最大列数，以及图像的固定宽度和它们之间的间隙选择三列作为最小列数，因为可以在Web上找到的网格图像排列通常至少有三列。图 1显示了五种显示模式，范围从三列到七列。滚动速度（SPEED）可以采用5个值，即5、10、15、20或25，分别对应于125、250、375、500和625像素/秒。我们预计5和25是测试者被指示点击目标图像，并在看到其中一个图像时大声说出“看到”这个词我们认为在以图像为中心的半径为140像素的圆内检测到的所有注视都是实际上之所以考虑这个额外的空间（即相邻图片之间的间隙），是因为特别是在高速下，凝视记录软件会引入错误，无法记录所有必要的视频帧。一些初步的实验使我们能够确定，140像素半径的圆（我们将在下文中称为目标圆）足以补偿该误差。列数的所有可能组合（3、4、5、6、7），速度（5，10，15，20，25）和目标对象（火车，飞机，汽车，摩托车，船舶），使用25 25平方设计。25个COLUMNS-SPEED组合中的每一个因此，我们从50名测试人员中收集了249份录音作为眼动仪，我们使用了Tobii 1750，它将目光跟踪传感器和近红外光发射器集成到1280 × 1024像素（17“）的屏幕中。使用TobiiStudio软件进行实验并记录注视数据。4. 结果根据对不同数据集进行的Kolmogorov-Smirnov检验结果，使用参数和非参数统计（5%显著性水平）进行以下统计分析，以确定分布是否呈正态。在分析中，我们考虑了两个点击的目标图像，即，实际上用鼠标点击的图片，以及看到的目标图片，即测试人员声称通过说“看到”检测到的所有目标图片（点击或未点击）这些检测随后通过检查所有50名测试者的凝视回放来确认或否认··M. 波尔塔湾Ricotti/视觉信息学1（2017）1619=-=-= −Fig. 1. 具有三列、四列、五列、六列和七列的图像网格。图二. 点击（a）和看到（b）目标图像的平均数量取决于列数和滚动速度。当然，我们的假设是，特定的目标对象（火车，飞机等）不影响测试结果。为此，我们计算了每个目标受试者和25个列-速度组合中每一个的正确看到的图像不同目标的这些平均值差异非常小：计算它们的标准差，仍然对于每种COLUMNS-SPEED组合，在11种情况下它们小于0.5，在5种情况下在此外，在不同的组合中，没有一个目标受试者总是比其他受试者更多或更少。4.1. 用户性能图图2显示了用户在正确点击（a）和看到（b）目标图像时使用不同COLUMNS-SPEED组合的性能。图3在单个直方图中显示了相同的信息，也指示了错误点击的图像数量图 4显示了点击和看到的目标图像的数量以及它们的“差异”，基于列数（a）和速度（b）。从图2、图3和图4可以看出，并且可以合理地预期，列数和滚动速度确实影响看到和点击的目标图像的数量然而，虽然这两个值在列数增加时类似地减小（图4（a）），但点击图像的数量随着滚动速度的增加而更快地减少（图4（a））。 4（b））：尽管用户可能能够注意到目标图像，但是在高速下点击它变得非常困难-“反应时间”不能应付快速滚动的网格。关于错误率，从图3中可以看出，错误点击图像的平均数量总是非常低（所有目标图像都非常容易识别）。仅考虑列数，未发现列数与错误点击的目标图像之间存在显著相关性：Pearson 's r. 43页 . 47.同样对于滚动速度，没有发现相关性，尽管在这种情况下的结果接近显著性（Pearson 's r. 859，p.062）。从统计学的角度来看，我们推断列数和点击的目标图像之间存在显著的相关性：Pearson 's r。99，p<. 001.同样，网格速度和点击目标之间存在显著相关性20M. 波尔塔湾Ricotti/视觉信息学1（2017）16= −= −== −图三. 每种列数和滚动速度组合的点击、看到和错误点击目标图像的平均数量。见图4。基于列数（a）和速度（b），点击和看到的目标图像的平均数量及其差异。图像来源：Pearson 's R. 99，p<. 01.类似地，列数和所看到的目标图像之间存在显著相关性：Pearson 's r。98，p<.01.网格速度和看到的目标图像之间也有显着的相关性：Pearson的r = −。99，p<. 001.4.2. 凝视行为为了研究测试者注视点在滚动网格上的分布对于每一个记录，我们然后确定这三个区域中的哪一个获得最多的注视。我们发现，几乎所有的参与者都倾向于将目光集中在屏幕的中部和下部，而在极少数情况下（249个记录中只有9个， 3.6%），测试人员倾向于将目光集中在屏幕的上部在96%的病例中，最受关注的区域包含至少50%的注视，在61%的病例中超过60%。在249例病例中，只有30例（12%）最受关注的区域包括较少的注视（21例介于45%和50%之间，8例介于40%和45%之间，1例介于35%和40%之间）。图图5显示了三个地区的注视分布情况，考虑到，分别地，仅变量图图6显示了凝视图的三个示例（注视序列的图形表示，用面积与其持续时间成比例的圆圈表示），其中注视主要集中在底部（6（a））、中心（6（b））和顶部（6（c））区域。根据图 5、列数较少（少于6列）时，大多数测试者倾向于看屏幕的底部，而当列数增加时，注视倾向于集中在中心区域。类似地，关于滚动速度，当速度不高（小于15）时，测试者倾向于看屏幕的底部，而随着速度的增加，注视倾向于集中在中心区域。事实上，列的数量和将目光集中在中央的测试者的数量之间存在显著的相关性（Spear-man的rho. 47，p<. 05）和更低（Spearman 's rho.52，p<. 01）部分屏幕。演示速度和将目光集中在中央的测试者数量之间也存在显着相关性（斯皮尔曼的rho =。60，p<. 01）和更低（斯皮尔曼的rho = −。60，p<. 01）屏幕区域。M. 波尔塔湾Ricotti/视觉信息学1（2017）1621==== −=== −=图五. 根据列数（a）和速度（b）在顶部、底部和中心区域之间的注视分布。对于X轴上的每个值，直方图表示每个区域的记录（即呈现）的数量，在该区域中检测到大多数注视。见图6。注视点主要集中在屏幕底部（a）、中心（b）和顶部（c）区域的凝视图示例见图7。主要将目光集中在顶部、中心和底部区域的测试者点击的目标图像的平均数量。仅考虑中心和底部区域，几乎接受所有注视，我们还调查了注视的位置是否与测试人员的表现有关在列数和演示速度的25种可能组合中，我们只考虑了21种情况，其中既有观看中心区域的测试者，也有观看底部区域的测试者。从图中的直方图。 7，我们可以看到，对于21种组合中的11种组合，将目光主要集中在屏幕中心部分的测试者点击的目标图像的平均数量高于将目光主要集中在中心区域的测试者点击的目标图像的平均数量，而相反的情况发生了9次（在一种情况下，两个数字相同）。类似地，从图中的直方图。 8，我们可以注意到，将目光主要集中在屏幕下部的测试者看到的目标图像的平均数量高于看到的目标图像的平均数量在21种组合中，有10种组合的测试者将目光主要集中在中心区域，而相反的情况发生了8次（在3种情况下，两个数字完全相同）。然而，使用独立样本t检验，我们推断上述差异在统计学上并不显著。将目光主要集中在屏幕中心的参与者的点击目标图像的平均数量为4.97（标准差3。28），而将目光主要集中在底部区域的参与者的平均值为5.21（stdev3 .第三章。15）：t（40）。24，p. 81.类似地，将目光主要集中在屏幕中心的参与者的所看到的目标图像的数量的平均值是7.5（标准差2. 而将目光主要集中在底部区域的参与者为7.94（stdev1 .一、66）：t（40）.76，p. 45.因此，虽然网格速度和列数似乎与最受关注的屏幕区域有明显的联系（顶部，22M. 波尔塔湾Ricotti/视觉信息学1（2017）16=-=-见图8。主要将目光集中在顶部、中心和底部区域的测试人员看到的目标图像的平均数量。见图9。不同列数（a）和速度（b）的平均扫描路径长度。表1列数和演示速度的每个组合的持续时间（秒）。列数对应的组合。从图10中的直方图可以看出，归一化扫描路径长度随着列数和网格速度而增加。Kruskal-Wallis检验表明，存在显著的34567列数和标准化扫描路径长度之间的关系速度5101397010954904577396632（Mdn= 1108。83，χ2= 97。17，p<. 001）。此外，速度和标准化速度之间也存在显著相关性，15 46 36 30 26 2220 35 26 22 20 1725 26 21 18 16 14中心或底部），此行为不会直接影响用户性能。底部和顶部区域的注视百分比之间的平均差异（绝对值）（42.72%）明显高于中心和顶部区域的注视百分比之间的平均差异（28.59%）。底部和中部的百分比之间的平均差异（46.84%）与底部和顶部之间的百分比（42.72%）大致相似。总的来说，在249次注视中，底部区域的注视百分比高于中部区域的注视百分比126次（56.6%）。关于顶部区域，在249次中，中心的注视百分比高于顶部的236次（94.78%），而在底部的注视百分比高于顶部的177次（71.08%）。4.3. 扫描路径长度可以考虑的另一个度量是扫描路径长度，即，所有连续注视点之间的欧几里得距离之和（以像素为单位）我们观察到扫描路径长度随着网格速度和列数的增加而减小（图9），然而，这是非常明显的，因为随着速度的提高或列数的增加，列（因此更多的图像），测试持续时间更短，测试人员看屏幕的时间更少（表1列出了所有演示文稿的持续时间，以秒表示因此，我们还考虑了归一化的扫描路径长度，其通过将平均扫描路径长度除以持续时间来扫描路径长度（Mdn 1108. 83，χ250。15，p<. 001）和扫描路径长度（Mdn 35556. 82，χ2190。73，p<. 001）。图11示出了取决于列数和网格速度两者的扫描路径和归一化扫描路径长度5. 讨论和结论不幸的是，这是不可能明确回答我们的第一个研究问题（“是否有任何最佳的组合列数和滚动速度，以保证一个'好'的性能时，目的是找到特定的主题在一个图像集？”）因为最好的组合取决于具体的环境。当然，具有较少列和较低速度的组合然而，这些组合也很少受到测试人员的赞赏，他们发现（例如）速度5（125px/s）太慢和此外，测试人员发现速度25（625 px/s）太快太累，因为需要非常高的集中精力：特别是，最大列数（7）和最大速度（25）的组合被所有测试人员判断为相反，对于列数没有表示特别的主观偏好我们可以注意到，错误点击图像的平均数量总是非常低，这可能是由于目标图像非常容易识别。作为交互设计师的指导方针，我们可以说：当需要精确搜索时，并且用户必须能够点击所识别的图像，·M. 波尔塔湾Ricotti/视觉信息学1（2017）1623见图10。不同列数和速度的标准化平均扫描路径长度。见图11。扫描路径（a）和标准化扫描路径（b）长度取决于列数和网格速度。应该选择低数量的柱和有限的速度--在我们的实验条件下，大约不超过5个柱和最多10（250 px/s）的速度。或者，可以选择更多的列和更高的速度（大约多达六列和速度15），只要用户在他或她看到时可以停止呈现目标图像（例如，通过按键盘上的键），以通过手动滚动执行精确检查。当不强制进行精确的搜索时（因为不需要搜索一组中的所有目标图像，如当简单地搜索用于装饰目的的图片时），可以采用具有更多列数和更高速度的组合，使得呈现时间可以更短。根据是否需要点击目标图像，可以选择中等到高数量的列和速度（例如，从5-15到7-20的然而，由于所有测试人员报告的负面经验，应尽可能避免速度25。关于我们的第二个研究问题（“图像搜索是否具有任何特定的凝视行为？如果是这样，这些行为是否取决于列数和滚动速度？我们可以肯定地回答，是的，列数和滚动速度对用户的注视行为有影响。特别是，在列数少和速度低的情况下，用户倾向于看屏幕的下部，图像从那里进入。然而，随着这两个参数的值增加，视线转移到中央屏幕区域：由于搜索任务变得更加困难，因此在从底部到中心的路线期间识别目标图像的可用时间更长，为用户提供了一定的“优势”。屏幕上方的区域可能很少有人关注，因为图片即将消失，用户的目光“本能地”更集中在新出现的图像上。然而，用户的表现（点击和看到的目标图像）似乎与屏幕上观察最多的区域没有明显的联系。底部和顶部区域中的注视百分比之间的平均差异（绝对值）明显高于中心和顶部区域中的百分比之间的平均差异，这可能是由于以下事实：当注视主要集中在屏幕的中心或上部时，注视可以更容易地越过两个区域之间的边界与底部区域和顶部区域之间的注视百分比的平均差近似相当的是底部区域和中心区域之间的注视百分比的平均差：这意味着当注视聚焦在中间或下部区域上时，它倾向于更稳定地停留在那里，而不越过两个区域之间的边界底部和中心几乎同样分享用户的注意力。比较中心、底部和顶部，我们可以观察到中心的注视百分比几乎总是高于顶部（ 94.78% ），而底部的注视百分比在少数情况下高于顶部（71.08%）。同样重要的是要注意，归一化扫描路径长度随着网格速度和列数的增加而增加。这意味着时间单位中的交互设计师的另一个指导方针是，由于高标准化扫描路径长度使得用户的搜索任务非常苛刻，因此应该限制具有许多列和高速的作为自动滚动图像网格的应用场景的示例，让我们考虑以下情况，其特征在于：不同的目标和需求：医生需要浏览一个庞大的皮肤肿瘤图像数据库，将其与患者的图像进行比较：为了加快这一过程，可以使用自动滚动网格，前提是选择具有非常高准确性（接近100%）的组合，用于点击和简单查看。在这种情况下，可以选择图3的前六个组合中的一个（低列数和速度）。在服装店中，屏幕可以显示滚动网格，该滚动网格示出可获得的不同的衣服：一旦顾客购买了不同的衣服，···24M. 波尔塔湾Ricotti/视觉信息学1（2017）16看到他或她喜欢的衣服，售货员可以被要求指出在哪里可以找到相应的衣服。在这种情况下，用户不需要进行鼠标选择，因此可以使用更高的速度。例如，可以选择组合3在销售服装的电子商务网站中，可以呈现类似于先前示例中提出的滚动然而，在这种情况下，用户也应该能够选择他们喜欢的服装，而不仅仅是看到它们。在这种情况下，组合6鉴于对图像网格显示的研究非常有限，特别是对自动滚动网格的研究，我们认为这项工作可以成为对该主题进行更深入研究的起点。未来的研究将考虑额外的参数（如图像大小）和更多的控制变量值（例如，列数此外，将考虑网格布局的变体，例如“圆柱体"显示，其中图像布置在3D渲染的移动环境也将被考虑，有限的屏幕尺寸带来了额外的引用Beck，F.，Burch，M.，Vehlow，C.，Diehl，S.，Weiskopf，D.，2012. 动态图形可视化中的快速串行可视化表示。2012年IEEE Symposium onVisual Languagesand Human-Centric Computing，VL/HCC。IEEE，第 185-192Bederson，B. B.，2001. Photomesa：使用量子树图和气泡图的可缩放图像浏览器。在： Proceedings of the 14th Annual ACMSymposium on User InterfaceSoftware and Technology。ACM，pp. 71-80库珀，K.，de Bruijn，O.，斯宾塞河Witkowski，M.，2006. 图像集合的静态和移动呈现模式的比较。在：先进的视觉界面工作会议的会议记录。ACM，pp. 381-388Corsato，S.，Mosconi，M.，Porta，M.，2008年使用RSVP显示技术的图像搜索活动的眼动跟踪方法。在：先进的视觉界面工作会议的会议记录。ACM，pp. 416-420Duchowski，A.，2 0 0 7 年眼动追踪方法：理论与实践，卷。373.Springer Science Business Media.范，X.，Xie，X.，妈妈，W。-是的，张洪-J. 和Zhou，H.-Q. 2003年。移动设备上基于视觉注意力2003年：多媒体与博览会。ICME'03。诉讼2003 InternationalConference on，vol. 1，IEEE，pp. I-53.五十岚，T.，欣克利，K.，2000. 速度相关的自动缩放浏览大型文档。第13届ACM用户界面软件与技术研讨会论文集。ACM，pp. 139-148Kleiman，Y.，Lanir，J.，Danon，D.，Felberbaum，Y.，Cohen-Or，D.，2015年。DynamicMaps：通过大量图像进行基于相似性的浏览。第33届ACM计算机系统人为因素年会论文集。ACM，pp. 995-1004刘洪，Xie，X.，唐，X.，李志W.，妈妈，W。-是的，2004年有效浏览网页图像搜索结果。第六届ACM SIGMM多媒体信息检索国际研讨会论文集。ACM，pp. 84-90Oyekoya ， O.K. ， Stentiford ， F.W. ， 2006. 眼动追踪视觉探索的新界面。 BTTechnol. J.24（3），57- 66.Porta，M.，2006. 通过非传统的可视化技术浏览大量图像。在：先进的视觉界面工作会议的会议记录。ACM，pp. 440-444Porta，M.，2009. 新的可视化模式，有效的图像呈现。Int. J. 图像图表。9（01），27- 49.Ren，K.，萨尔瓦斯河Calic，J.，2009. FreeEye：直观的照片汇总。第17届ACM多媒体国际会议论文集。ACM，pp. 1127-1128Schaefer ， G. ， 2010. 下一代大型图片库浏览环境。 Multimedia Tools Appl.47（1），105- 120.Schoeffmann，K.，Ahlström，D.，2012. 使用3d圆柱形界面进行图像浏览以提高视觉搜索性能。2012年第13届多媒体互动服务图像分析国际研讨会。IEEE，第一比四Shneiderman，B.，康，H.，2000. 直接注释：一种用于标记照片的拖放策略。见：信息可视化，2000年。诉讼 IEEE Inter-IEEE全国会议，pp. 88-95斯宾塞河2002年。快速、连续、直观：一种极具潜力的展示技术。Inf. Vis. 1（1），13斯宾塞河Witkowski，M.，2013年。快速系列视觉呈现：认知设计。斯普林格。斯特朗，Hoeber，O.，龚，M.，2010. 视觉图像浏览和探索（Vibe）：用户对图像搜索任务的评估。在：国际会议上主动媒体技术。施普林格，pp. 424-435van der Corput，P.，van Wijk，J.J.，2016. ICLIC：大型图像集合的交互式分类。2016年IEEE太平洋可视化研讨会（PacificVis）。IEEE，第 152-159Witkowski，M.，斯宾塞河2012. 快速系列视觉呈现：设计方法。Inf. Vis. 11（4），301- 318。·

下载后可阅读完整内容，剩余1页未读，立即下载