文本大数据在经济学与金融学的应用:文献综述

需积分: 0 1 下载量 143 浏览量 更新于2024-06-22 收藏 1.23MB PDF 举报
"本文是北京大学国家发展研究院关于文本大数据分析在经济学和金融学中应用的文献综述,由沈艳、陈赟、黄卓撰写。文章探讨了文本大数据的特性,如多样化来源、快速增长的数据量和高频更新,并概述了处理文本大数据的挑战。它详细介绍了信息提取的步骤,包括词典法、机器学习和深度学习技术的运用。在经济学领域,文本大数据用于评估经济和政策不确定性、行业动态监测、商业周期预测以及媒体政治倾向量化。在金融学领域,它用于衡量投资者情绪、媒体关注度、隐含波动率和投资者意见分歧。文章全面梳理了相关研究的数据源、方法和结果,并展望了基于文本大数据的实证分析未来发展趋势,关键词涉及文本大数据、机器学习、深度学习、不确定性以及投资者情绪。" 这篇文献综述深入探讨了文本大数据在经济学和金融学研究中的关键作用。首先,它强调了文本大数据的独特性,指出其数据来源广泛、数据量庞大且更新频繁,这些特性使得文本大数据成为获取新信息和独特分析视角的有效工具。然而,处理如此大规模的非结构化数据也带来了挑战,这需要利用先进的信息提取技术。 在信息提取方面,作者提到了三种主要的方法:词典法、机器学习和深度学习。词典法依赖于预定义的词汇表来识别特定主题或情感;机器学习则通过训练模型来自动识别和分类文本;而深度学习,如自然语言处理(NLP)中的神经网络模型,可以理解语义并进行更复杂的分析。 在经济学研究中,文本大数据的应用主要包括评估经济和政策不确定性,比如通过分析政策公告或新闻报道来量化不确定性水平。此外,它还用于监测基于文本的行业动态,以捕捉行业的实时变化。商业周期的度量和预测也是其重要用途,通过对宏观经济报告或企业公告的分析,可以提前洞察经济的兴衰趋势。同时,文本分析还能量化媒体的政治倾向,揭示媒体立场对公众观点的影响。 在金融学领域,文本大数据被用来测量投资者情绪,通过对投资者评论和新闻报道的分析来了解市场情绪的变化。媒体关注度的度量也是一个重要应用,它可以反映市场对特定事件的关注程度。此外,文本大数据还能帮助计算基于新闻的隐含波动率,这为市场风险评估提供了额外的参考。投资者意见分歧的量化则有助于理解市场的分歧程度,预测市场走势。 综述最后,作者讨论了使用文本大数据进行实证分析的新兴特点,比如实时性和动态性,并预测了未来的研究方向,可能包括更精细的情感分析、跨领域的综合应用以及更复杂的深度学习模型开发。这些研究趋势将推动经济学和金融学的研究进一步融入大数据时代,提升研究的精度和广度。