上市公司数字化转型指标测度研究(2000-2022)

版权申诉
5星 · 超过95%的资源 1 下载量 75 浏览量 更新于2024-11-20 1 收藏 513B ZIP 举报
资源摘要信息:"2022-2000年上市公司企业数字化转型指标测度数据" 知识点概述: 1. 资料名称: 本资料集包括了从2000年至2022年期间,上海交易所和深圳交易所的全部A股上市公司年度报告中的企业数字化转型相关数据。通过分析这些数据,研究者和业界人士可以对企业在这段时间内的数字化转型程度进行量化评估和对比分析。 2. 计算方式: 数据的收集和处理采用了多种工具和方法。首先,使用Python爬虫技术自动化地从两大交易所的官方网站获取上市企业的年度报告。接着,利用Java PDFbox库来提取PDF格式年报中的文本内容,构建数据池以备后续分析。 在数据处理上,研究者基于预先设定的特征词(可能是与数字化转型相关的专业术语或关键词),使用Python进行搜索、匹配和词频计数。以此方式,对上市企业的数字化转型程度进行初步分类归集,并通过关键技术和方向的词频统计,构建出企业数字化转型的指标体系。 3. 资料范围: 本资料集不仅仅包括了处理后的原始数据,还提供了使用的计算代码和得到的计算结果。这些内容对于理解数据的处理过程和结果的可靠性至关重要。 4. 参考文献: 提供了参考文献的具体信息,该文献为吴非等人的研究《企业数字化转型与资本市场表现——来自股票流动性的经验证据》,发表在《管理世界》杂志上。文献的参考对于本数据集的研究背景和方法提供了理论依据。 5. 数据字段说明: 数据集中的字段可能包括企业ID、年份、证券代码、股票简称、行业代码(其中制造业取两位代码,其他行业用大类表示)、五维度词频数年报合计、数字化转型程度1、五维度词频数管理层讨论合计、数字化转型程度2、AITechnology年报、B等。 6. 商业资料: 本数据集属于商业资料范畴,能够为商业决策提供数据支持,同时也能够用于学术研究。 7. 文件名称列表: 提供的压缩文件名为"6777.zip",文件内包含了一个说明文件"说明.txt"。压缩文件包含的数据量可能很大,因此进行了压缩处理以便于传输和存储。说明文件可能详细描述了数据集的使用方法、数据字段含义、计算公式、数据集结构以及可能的其他相关信息。 总结: 这份数据集是研究上市公司数字化转型进程和效果的宝贵资料,它通过自动化技术手段搜集了大量原始文本数据,并结合了统计和文本分析技术,对企业的数字化程度进行了量化研究。这有助于理解数字化转型对企业绩效的影响,同时对于投资者、企业管理层、政策制定者及研究人员都具有重要的参考价值。不过,在使用该数据集时,应注意研究结果的时效性和行业差异性,以确保分析的准确性和适用性。