机器学习VS字典方法:披露情绪捕获新视角

需积分: 16 1 下载量 200 浏览量 更新于2024-07-09 收藏 1.35MB PDF 举报
"这篇研究论文探讨了在文本分析领域中,机器学习方法与基于字典方法在捕捉披露情绪(如企业10-K申请和电话会议中的情绪)上的表现。研究者Richard Frankel, Jared Jennings和Joshua Lee通过比较这两种方法,发现机器学习技术在解释情绪与回报关系的能力上显著优于基于字典的方法。" 文章中提到,10-K申请是企业向美国证券交易委员会提交的年度报告,其中包含了公司的财务状况和业务概述,这些文档的情感分析对于投资者理解公司前景至关重要。研究人员使用回报率作为评估情绪的标准,即通过观察报告发布后股票价格的变化来评估市场对信息披露的反应。 机器学习方法在10-K申请日期的情绪捕捉上表现出色,能够更好地解释回报。这表明机器学习模型能更准确地识别和量化文本中的情绪信号,并将其转化为可解释的经济行为。另一方面,基于Loughran和McDonald(2011)字典的方法在研究期间对10-K申请日期的回报解释力较弱,尤其是在电话会议期间。 电话会议是公司管理层与投资者直接交流的重要场合,情感分析在此同样重要。研究发现,机器学习方法在此场景下相对于Loughran和McDonald词典方法的提升更为显著,显示了其在复杂语境下处理情绪信息的优越性。此外,研究者还指出,随机森林回归树作为一种机器学习算法,在捕捉披露情绪时表现最佳,简化了应用流程。 该研究强调了机器学习在文本情绪分析中的潜力,特别是与基于字典的传统方法相比,它提供了更强大、更可靠的情绪度量工具,且易于实施。这意味着对于金融分析师和数据科学家来说,采用机器学习技术可能能更有效地从大量文本数据中提取有价值的信息,从而辅助决策并预测市场动态。 这篇论文揭示了机器学习在文本分析特别是情绪检测方面的优势,尤其是在金融信息披露的情境下,机器学习方法可以提供更加精确和全面的情绪洞察,有助于改进风险管理、投资策略以及企业沟通效果的评估。这为未来的金融文本分析研究提供了新的方向和工具。