1. day2020-11-9.csv中记录了2020年11月9号爬取的上市公司的财务报表(有些项目缺失)。 试根据该表格中的数据,完成以下操作。   1. 选出净利润大于1000万的上市公司名称; 2. 选出营业收入大于10亿的上市公司名称; 3. 净利润/营业总收入>1%的上市公司名称; 4. 选出净利润同比>0的上市公司名称; 5. 找出满足以上四个条件的上市公司名称,即为S; 6. 根据行情数据计算,每个企业披露财报后,五天内股价是否上涨,做成一个excel表格;   提示: 1. 每个上市公司都有一个唯一的6位数字标记,就是上市公司代码。上交所上市的股票以‘6’开头,例如,用友网络的股票代码是600588;深交所上市的股票以0开头,例如,平安银行的代码是000001。深交所上市的股票代码在存储为csv或者excel文件时,前面的0被忽略掉了。例如,平安银行的代码在财务数据中是1,这实际上是错误的。 2. 对于某些股票,如果步骤1-5中涉及到的指标是缺失值,可以忽略掉,不计入统计; 3. 要使用pandas模块;for循环(对所有文件进行遍历),df.pct_change()可以对序列求系列的增长率; 4. 先将数据的单位’万亿’, ”亿“,“万”,等单位转化为数字;

时间: 2024-04-21 12:23:37 浏览: 11
好的,我会根据你提供的条件来完成这些操作。首先,我将加载并处理给定的财务报表数据。 ```python import pandas as pd # 读取财务报表数据 df = pd.read_csv('day2020-11-9.csv') # 处理数据单位 df['净利润'] = df['净利润'].apply(lambda x: float(x.strip('万亿亿'))) df['营业收入'] = df['营业收入'].apply(lambda x: float(x.strip('万亿亿'))) # 选出净利润大于1000万的上市公司名称 df_profit = df[df['净利润'] > 1000]['上市公司名称'] # 选出营业收入大于10亿的上市公司名称 df_revenue = df[df['营业收入'] > 10]['上市公司名称'] # 计算净利润/营业总收入 df_profit_ratio = df[df['营业总收入'].notnull()] df_profit_ratio = df_profit_ratio[df_profit_ratio['营业总收入'] != 0] df_profit_ratio['净利润/营业总收入'] = df_profit_ratio['净利润'] / df_profit_ratio['营业总收入'] df_profit_ratio = df_profit_ratio[df_profit_ratio['净利润/营业总收入'] > 0.01]['上市公司名称'] # 选出净利润同比>0的上市公司名称 df_profit_growth = df[df['净利润同比'].notnull()] df_profit_growth = df_profit_growth[df_profit_growth['净利润同比'] > 0]['上市公司名称'] # 找出满足以上四个条件的上市公司名称 S = pd.Series(list(set(df_profit) & set(df_revenue) & set(df_profit_ratio) & set(df_profit_growth))) # 保存S到Excel表格 S.to_excel('S.xlsx', index=False) ``` 接下来,我将根据行情数据计算每个企业披露财报后,五天内股价是否上涨,并将结果保存到另一个Excel表格中。请提供行情数据的格式和文件名,以便我可以继续处理。

最新推荐

recommend-type

2020桃园ROS暑期学校Nav2 ROS2 Foxy CycloneDDS-下一代ROS.pdf

Youth Affairs Taoyuan City , ADLINK, Intel, NVIDIA, AWS, Microsoft are teaching 250 students live ... This is a 5 day education program from 9:00-17:00 daily at the Zhongyuan University School of Electri
recommend-type

Python实现将通信达.day文件读取为DataFrame

今天小编就为大家分享一篇Python实现将通信达.day文件读取为DataFrame,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
recommend-type

2020 CSP-S2 提高级第二轮试题( 原noip提高组复赛)

略日,其定义为从公元前 4713 年 1 月 1 日正午 12 点到此后某一时刻间所经过 的天数,不满一天者用小数表达。若利用这一天文学历法,则每一个时刻都将 被均匀的映射到数轴上,从而得以很方便的计算它们的差值。 ...
recommend-type

基于GEC6818五子棋游戏GEC6818_Gomoku.zip

五子棋游戏想必大家都非常熟悉,游戏规则十分简单。游戏开始后,玩家在游戏设置中选择人机对战,则系统执黑棋,玩家自己执白棋。双方轮流下一棋,先将横、竖或斜线的5个或5个以上同色棋子连成不间断的一排者为胜。 【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【技术】 Java、Python、Node.js、Spring Boot、Django、Express、MySQL、PostgreSQL、MongoDB、React、Angular、Vue、Bootstrap、Material-UI、Redis、Docker、Kubernetes
recommend-type

单片机C语言Proteus仿真实例左右来回的流水灯

单片机C语言Proteus仿真实例左右来回的流水灯提取方式是百度网盘分享地址
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

用matlab绘制高斯色噪声情况下的频率估计CRLB,其中w(n)是零均值高斯色噪声,w(n)=0.8*w(n-1)+e(n),e(n)服从零均值方差为se的高斯分布

以下是用matlab绘制高斯色噪声情况下频率估计CRLB的代码: ```matlab % 参数设置 N = 100; % 信号长度 se = 0.5; % 噪声方差 w = zeros(N,1); % 高斯色噪声 w(1) = randn(1)*sqrt(se); for n = 2:N w(n) = 0.8*w(n-1) + randn(1)*sqrt(se); end % 计算频率估计CRLB fs = 1; % 采样频率 df = 0.01; % 频率分辨率 f = 0:df:fs/2; % 频率范围 M = length(f); CRLB = zeros(M,1); for
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。