自动化创建分类法与XBRL US GAAP分类法结构比较

需积分: 5 0 下载量 38 浏览量 更新于2024-07-09 收藏 453KB PDF 举报
"这篇研究论文探讨了自动化分类法创建的过程,并将其与XBRL US GAAP分类法的结构进行了比较,主要关注于养老金披露。作者Vasundhara Chakraborty和Miklos Vasarhelyi使用10K报表的财务脚注数据,提出了一种半自动的分类法构建方法,旨在简化上市公司关键信息的提取。" 正文: 自动化分类法创建是文本数据分析中的一个重要步骤,特别是在财务报告领域。这项研究中,研究人员针对财务报表脚注的养老金计划信息,开发了一种新的方法,以解决由于不同公司报告结构和术语差异导致的信息提取难题。他们首先从SEC EDGAR系统中收集了10K报表,这是一个包含公开上市公司财务信息的数据库。接着,他们专注于养老金脚注,提取相关信息,并对数据进行重组。 在数据处理阶段,研究人员应用了分层聚类算法,这是一种将数据点根据相似性归类到不同层次结构中的统计方法。通过这种方法,他们构建了一个层次化的分类结构,使得信息更加有序和可理解。这个过程的部分自动化减轻了传统分类法创建的复杂性和耗时性。 对比XBRL US GAAP分类法,XBRL(eXtensible Business Reporting Language)是一种标准格式,用于电子化地报告财务信息,尤其是遵循美国公认会计原则(GAAP)。研究发现,公司报告的趋势倾向于更高级别的聚合,这意味着他们在养老金披露中可能会合并某些信息,而不是详细列出所有细节。此外,分析显示,不同公司在脚注中可能使用不同的术语或引入新的部分,甚至有时会遗漏某些术语,这突显了自动生成分类法的必要性和挑战。 该研究的贡献在于:(i) 提出了一种利用历史数据对分类法创建过程进行形式化和半自动化的创新方法;(ii) 开发了通用的解析工具,这些工具可以辅助分类法的构建;(iii) 展示了与官方XBRL US GAAP分类法在结构上的差异,强调了自定义分类法的价值;(iv) 阐明了这些解析和匹配工具在会计领域的其他探索性研究中可能的应用。 通过这种方法,研究人员不仅能够揭示不同公司养老金披露的异同,还为未来的文本挖掘和信息提取提供了有价值的工具。这将有助于提升财务报告分析的效率和准确性,同时为监管机构、分析师和投资者提供了更深入理解公司财务状况的途径。