ACE: 快速高效的新序列识别方法，适用于2D预测与计数

67 浏览量更新于2024-06-20 收藏 1.84MB PDF 举报

本文主要探讨了一种创新的序列识别方法——聚集交叉熵（ACE），这是一种针对2D预测和计数问题设计的高效算法。ACE在性能、速度、存储需求和应用范围上展现出了显著的优势。首先，ACE作为一种新型损失函数，其性能可与传统的连接时序分类（CTC）和注意力机制相媲美，但具有更快的计算速度，因为其核心计算仅依赖于四个基本公式，从而减少了计算复杂度。同时，由于并行推理的优化，ACE的反向传播过程几乎达到了常数级别的时间复杂度，这意味着在大规模数据处理时，它能够提供更高的吞吐量。在存储需求方面，ACE显著优于其他方法，因为它不需要额外存储大量的模型参数，运行时内存占用也非常小，这对于资源有限的应用场景来说是非常重要的。这不仅降低了硬件负担，还简化了部署和维护过程。 ACE的独特之处在于其灵活性。它可以接受2D预测结果作为输入，而无需先将其扁平化为1D序列，这使得它在处理诸如数学表达式识别这类具有复杂空间结构的2D预测任务时更为得心应手。此外，它对监督信息的要求相对较低，只需要字符及其在序列中的位置，这使得它不仅能用于标准的序列标注任务，还能扩展到计数问题，如识别图像中的字符总数。作者们通过华南理工大学的研究团队，展示了ACE的开源代码，鼓励更多的研究者和开发者探索和利用这一创新技术。聚集交叉熵作为一种高效且易于集成的序列识别工具，正在挑战传统方法，并有可能在未来推动2D预测和计数问题的解决效率和准确性。