大规模图表摘要：Chart-to-Text研究与挑战

37 浏览量更新于2024-06-19 收藏 2.08MB PDF 举报

"Chart-to-Text：大规模图表摘要" 本文探讨了一项名为“Chart-to-Text”的研究，旨在解决从图表中生成自然语言摘要的问题，以帮助人们更有效地理解和推断图表中的关键信息。随着数据可视化的广泛应用，如条形图、折线图和饼图，自动图表摘要的任务变得越来越重要，因为它可以减轻认知负担，提高数据分析效率。 Chart-to-text项目提供了两个大型数据集，总计包含44,096个不同主题和类型的图表，为研究和开发图表摘要的模型提供了丰富的资源。数据集的构建过程包括对各种来源的图表进行收集、解析和注释，以确保多样性，并允许模型学习处理不同的数据表示和可视化模式。为了处理这一挑战，研究者提出使用先进的神经模型作为基线，其中包括两种方法：一种假设图表的原始数据表格可访问，另一种则需要从图表图像中直接提取数据。这些模型借鉴了图像字幕和数据到文本生成的技术，展示了在生成流畅摘要方面的潜力，但同时也暴露出一些问题，如幻觉（生成不准确的信息）和事实错误。此外，它们在捕捉和解释图表中的复杂模式和趋势方面也面临困难。通过自动和人工评估，研究人员发现最佳模型虽然能够生成连贯的文本，但在忠实于图表内容方面仍有待改进。这表明，尽管当前的技术已经取得了一定的进步，但要实现完全准确和理解深刻的图表摘要，还有很长的路要走。举例来说，对于一个关于新加坡2019年商品进口的图表，一个模型（如Gold）生成的摘要指出机械和设备的进口额约为2368亿新元，矿物燃料和润滑油进口额为1027亿新元，而另一个模型（如TAB-T5）则以类似的方式重述了这些信息。这些摘要虽然简洁明了，但并未完全捕捉到图表的所有细节，例如，它们没有提及这些进口的价值排名。 Chart-to-Text项目为图表摘要的研究开辟了新的道路，但同时也揭示了现有技术的局限性。未来的工作需要集中在开发更加精确、能够理解复杂图表结构和趋势的模型，以便更好地服务于数据可视化领域的信息提取需求。

+v：mala2277获取更多论

文

图2：Pew数据集构建过程的各个阶段。

然后提取检测到的文本的边界框以提取几何特

征（

例如，文本

的标准化宽度和高度），并使

用它们来训练梯度提升分类器，该分类器将识

别的文本分类为以下类别之一：标题、轴标

签、图例和数据标签。由于图表类型的视觉风

格和结构各不相同，我们为每种图表类型训练

了一个单独的分类器我们手动标记了319个示

例（ 171 个条形图、 68 个折线图和 80 个饼

图），并将它们分别以8：1：1的比例拆分为

训练、验证和测试。我们的模型在我们的测试

集上实现了95.0%的整体精度和97.6%的标题

分类然后，我们使用我们的模型来预测

Pew

数

据集中剩余图表的文本角色。

如果图表图像没有相关的

alt

文本，我们将

提取的标题用作最终的图表如果

alt

文本可

用，我们通过将其与提取的标题进行比较来获

取较长的文本

(ii)

候选段落的识别：

我们观察到，相关段落

往往出现在给定图表的附近，并与图表共享一

些内容（

例如，

轴标签、数据值）。我们首

先使用这个接近度标准来形成候选段落

的列

表。具体来说，对于每个图表，我们选择了与

图表相邻的段落以及它之前和之后的五个段落

作为候选段落（总共最多11个）。

接下来，我们使用了一种基于语法的方法来

自动选择相关段落

LrL

. 我们估计了

将

中的每个段落与其对应的图表关联为

rel=content×proximity ，其中 content 取匹

配

在段落和

OCR

提取的文本之间（数字标记被

赋予比词汇标记更高的权重，因为它们是关系

的更好指标

皮尤统计局

类型

简单

复杂

简单

复杂

酒吧

24,591

5,616

807

5,497

线

2,646

902

325

2,129

区域

105

散射

馅饼

409

325

表

223

424

总

27,869

6,942

1,486

7,799

表1：图表类型分布。

皮尤统计局

统计

简单

复杂

简单

复杂

#词汇。

39,191

18,621

9,905

18,067

Avg. 字符

295

334

571

635

Avg.

令牌

110

124

Avg. 句话

2.56

2.62

3.84

4.27

表2：图表到文本数据集统计。

在段落和图表之间匹配阈值和某个最小数量

的词汇和数字标记

，我们认为这样的段落

与

图表相关。我们根据经验设置了这个阈值，

并将其选择得非常高，以优先考虑准确率而

不是召回率。我们评估了我们的方法对一组

随机

抽样的

个图表和

769

个周围的

paragraphs

的有效性，发现召回率为

21.1%

，

精度

为

100%

。考虑到完美的精确度得分，我

们

认为

中的段落是相关的，为了

确认其余段

落的相关性，

我们进行了人体研究。

(iii)

大规模图表摘要：Chart-to-Text研究与挑战

Bugzilla-Guide

【Mini-Batch梯度下降】：批量大小对神经网络训练的影响

google 图表（chart）

11-EXCEL VBA漂亮的统计图表-折线面积图12.zip

730页PPT模板：LOGO与公司名图表集，全方位素材

数据可视化艺术：定制化图表设计

【flake8性能极致提升】：大规模代码库检查加速秘诀

Python-Docx入门指南：一步步成为文档处理高手（实用型）

10分钟打造个性化Bokeh图表：终极图表定制指南

图表批量生成：利用Python批量绘制图表的自动化方法

最新资源