python批量下载巨潮资讯网指定年份的年报代码

时间: 2023-06-26 14:09:20 浏览: 752

使用Python爬取巨潮资讯网中上市公司的年报，并进行文本分析代码

5星 · 资源好评率100%

可以使用 Python 中的 requests 和 BeautifulSoup 库来实现批量下载巨潮资讯网指定年份的年报代码。具体步骤如下： 1. 导入需要的库 ```python import os import requests from bs4 import BeautifulSoup ``` 2. 定义需要爬取的 URL ```python url = 'http://www.cninfo.com.cn/new/hisAnnouncement/query' ``` 3. 构造请求参数 ```python params = { 'stock': '', 'searchkey': '', 'plate': '', 'category': 'category_ndbg_szsh;', 'pageNum': 1, 'pageSize': 30, 'tabName': 'fulltext', 'sortName': '', 'sortType': '', 'limit': '', 'showTitle': '', 'seDate': 'xxxx-01-01~xxxx-12-31', # 替换为需要爬取的年份 } ``` 其中，`seDate` 参数指定需要爬取的年份。需要替换为你需要爬取的年份。 4. 发送请求并解析页面 ```python res = requests.get(url, params=params) soup = BeautifulSoup(res.text, 'html.parser') ``` 5. 获取总页数，并循环遍历每一页 ```python total_pages = int(soup.select_one('.total-pages').text) for page in range(total_pages): params['pageNum'] = page + 1 res = requests.get(url, params=params) soup = BeautifulSoup(res.text, 'html.parser') # 解析页面获取需要下载的文件 URL ``` 6. 解析页面获取需要下载的文件 URL ```python for tr in soup.select('.table-search-list tr'): file_url = tr.select_one('.download-links a')['href'] file_name = tr.select_one('.download-links a')['download'] # 下载文件 ``` 7. 下载文件 ```python res = requests.get(file_url) with open(file_name, 'wb') as f: f.write(res.content) ``` 完整代码如下： ```python import os import requests from bs4 import BeautifulSoup url = 'http://www.cninfo.com.cn/new/hisAnnouncement/query' params = { 'stock': '', 'searchkey': '', 'plate': '', 'category': 'category_ndbg_szsh;', 'pageNum': 1, 'pageSize': 30, 'tabName': 'fulltext', 'sortName': '', 'sortType': '', 'limit': '', 'showTitle': '', 'seDate': 'xxxx-01-01~xxxx-12-31', # 替换为需要爬取的年份 } res = requests.get(url, params=params) soup = BeautifulSoup(res.text, 'html.parser') total_pages = int(soup.select_one('.total-pages').text) for page in range(total_pages): params['pageNum'] = page + 1 res = requests.get(url, params=params) soup = BeautifulSoup(res.text, 'html.parser') for tr in soup.select('.table-search-list tr'): file_url = tr.select_one('.download-links a')['href'] file_name = tr.select_one('.download-links a')['download'] file_name = os.path.join('annual_reports', file_name) if not os.path.exists(file_name): res = requests.get(file_url) with open(file_name, 'wb') as f: f.write(res.content) ``` 需要注意的是，下载的文件保存在 `annual_reports` 文件夹下，如果该文件夹不存在需要先创建该文件夹。

阅读全文

python批量下载巨潮资讯网指定年份的年报代码

相关推荐

从巨潮资讯自动下载报告.zip

Python 2018 年度报告完整版（麻瓜编程译）

python批量下载巨潮资讯网年报代码

python爬取下载巨潮网指定公司的年报步骤答案

python爬取巨潮资讯网年报

python从巨潮网批量爬取年报

python从巨潮资讯网中获取指定企业的所属行业

python爬取巨潮资讯网

python爬巨潮网年报

可以帮我写一段在巨潮资讯网站批量下载上市公司年报的代码

python scapy爬取巨潮公司年报

python批量下载公司年报

python爬虫 巨潮资讯

python如何爬取巨潮网站中制造业上市公司年报

python巨潮资讯数字化转型

python批量旋转图片并保存到指定文件夹的代码

python 通过url列表批量下载大文件到指定位置

给出批量下载的Python代码

Python实现批量下载文件并且压缩zip格式的代码

最新推荐

python批量处理txt文件的实例代码

Python批量将图片灰度化的实现代码

Python实现图片批量加入水印代码实例

python批量赋值操作实例

python绘制BA无标度网络示例代码

Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南

管理建模和仿真的文件

Fluent UDF实战攻略：案例分析与高效代码编写

如何使用DPDK技术在云数据中心中实现高效率的流量监控与网络安全分析？

Apache RocketMQ Go客户端：全面支持与消息处理功能

python爬虫巨潮资讯