2020年沪深A股ST、*ST和PT股票数据及处理方法

版权申诉
0 下载量 119 浏览量 更新于2024-11-15 收藏 513B ZIP 举报
资源摘要信息:"★筛选数据★ 沪深A股是否ST、-ST或PT数据整理(附数据和Stata整理代码)更新至2020" 知识点详细说明: 1. ST、*ST与PT的定义及其影响: ST(Special Treatment)指的是“特别处理”,是指上市公司因连续两年财务状况出现异常,包括但不限于财务报表无法正常反映公司财务状况、重大违法违规行为等情况而被证券交易所特别处理。*ST(Special Treatment*)代表“退市风险警示”,是ST的升级版,当公司连续三年财务状况异常时,会被标记为*ST。PT(Particular Transfer)则指“暂停上市”,当上市公司因财务状况或其他问题需要暂停交易时使用,常见于公司连续三年亏损且无法满足上市标准的情况。 2. 剔除ST、*ST和PT公司的重要性: 在进行金融分析、股票投资或实证研究时,通常需要剔除ST、*ST或PT类上市公司,因为这些公司的财务状况和运营情况存在重大不确定性,可能会对研究结果产生偏差。此类公司的股价波动可能较大,风险较高,不符合一般上市公司的稳定性和可比性要求。 3. 剔除方法与数据处理: 剔除这些公司一般基于年末的状态判断,即在研究区间内的任何一个年份,如果公司的状态为ST、*ST或PT,则整个区间内该公司所有的样本数据都将被剔除。数据的来源通常来自专业的金融数据库,例如本资源中提到的Wind数据库。数据整理后将包含虚拟变量(0-1),直观表明各公司年末是否属于ST、PT或二者之一。 4. Stata软件的应用: Stata是一款统计分析软件,广泛应用于经济学、社会学、生物医学等领域,具有强大的数据处理、分析及图形绘制功能。Stata代码用于实现数据的自动化处理,包括数据导入、数据清洗、变量生成、数据分析等过程。在本资源中,Stata代码将辅助完成对沪深A股上市公司是否为ST、*ST或PT状态的判别和数据整理工作。 5. 时间区间与数据字段: 原始数据的时间区间为1991年至2020年,这为研究者提供了一个宽广的时间序列数据,有利于分析长期趋势和周期性变化。整理后的数据字段包括“年末是否ST”、“年末是否PT”和“年末是否ST或PT”,以及“区间内是否ST”、“区间内是否PT”和“区间内是否ST或PT”,这些字段作为虚拟变量能够为研究者提供清晰的公司状态信息。 6. 数据匹配与应用: 整理后的数据可以与研究者自己的数据进行匹配,以便进行更深入的分析。例如,在进行回归分析时,可以将这些虚拟变量作为控制变量或解释变量,以观察ST、*ST或PT状态对于其他经济指标的影响。 7. 大数据在金融分析中的作用: 大数据技术的应用正在金融行业中扮演越来越重要的角色,尤其是在处理大规模的股票交易数据、市场行情数据和公司财务数据时。通过大数据技术,分析师可以更快地处理和分析数据,发现市场趋势,评估风险,并做出更加精准的投资决策。 总结: 本资源为研究者提供了一套完整的关于沪深A股ST、*ST和PT状态的数据整理方法和工具,强调了在金融数据分析中剔除特定类型上市公司的重要性,并通过Stata软件实现了高效的数据处理。这不仅有助于提高研究的质量和准确性,也展示了大数据技术在金融分析中的实际应用。通过将原始数据和代码配合使用,研究者可以更好地理解市场动态,为投资决策提供科学依据。