处理与清洗增强TRACE数据的方法

需积分: 9 0 下载量 195 浏览量 更新于2024-07-09 收藏 168KB PDF 举报
"这篇研究论文补充了2009年《固定收益杂志》中的‘TRACE的流动性偏向’一文,详细介绍了如何清理增强的TRACE数据。作者Jens Dick-Nielsen在2014年12月发布了这篇论文,旨在更新交易数据过滤器,以适应处理增强的历史TRACE数据,并提供了相应的SAS代码,这些代码现在也包括了2012年的最新变更。文中提到,2007年原始交易报告中有670万个交易记录,但经过一系列的错误过滤、代理交易剔除和交易员重复计算交易的删除后,大约35%的原始交易被过滤掉。关键词涉及增强的TRACE数据、错误过滤和SAS代码,所属经济与金融分类为G10和G12。" 增强的TRACE数据是一种用于监控美国固定收益市场,特别是公司债券交易的重要工具。TRACE( Trade Reporting and Compliance Engine)由美国金融业监管局(FINRA)运营,旨在提高市场的透明度。这篇论文的重点在于如何处理和清理这些数据,以消除可能存在的偏误和错误。 错误过滤是清理过程的关键步骤,它涉及到识别并排除那些由于系统或人为错误导致的不准确交易记录。论文中提到的440,000个已知错误可能是数据录入错误或其他技术性问题。这些错误数据的删除有助于确保后续分析的准确性。 代理交易的剔除(780,000个记录)是为了区分经纪人之间的交易和经纪人与最终投资者之间的交易,因为这两类交易在流动性提供和价格发现上的作用可能有所不同。代理交易的处理对于理解市场深度和流动性至关重要。 交易员重复计算的交易(160万个记录)是另一个需要关注的问题。当同一笔交易被两个或更多交易员报告时,这可能导致交易量的夸大,因此需要进行删除以防止对交易活动的过度估计。 SAS代码的提供使得研究人员和从业者能够应用同样的过滤方法来处理他们自己的增强TRACE数据集,这对于一致性分析和研究是极其宝贵的。SAS是一种广泛使用的统计分析软件,尤其在金融和经济领域,其强大的数据处理能力使得复杂的清理任务变得可行。 这篇论文不仅揭示了TRACE数据清理的必要性,还提供了实际操作的方法和技术,对于那些依赖于TRACE数据进行固定收益市场研究的学者和从业人员来说,具有很高的参考价值。通过应用这些过滤和清理步骤,研究者可以更准确地理解市场流动性、交易行为以及定价效率。