写代码:爬取特定股票代码的2023年上市公司年报txt形式
时间: 2024-10-12 16:17:01 浏览: 47
在Python中,你可以使用requests库来发送HTTP请求获取网页内容,然后利用BeautifulSoup库解析HTML并提取你需要的信息。这里是一个简单的示例,展示如何爬取特定股票代码的2023年上市公司年报(假设是通过财经网站提供API,因为直接访问官网HTML结构可能会有变化):
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 股票代码(例如000001)
stock_code = "000001"
# API接口URL(如果有的话)
api_url = f"https://example.com/api/report?year=2023&code={stock_code}"
# 发送GET请求
response = requests.get(api_url)
# 检查请求是否成功
if response.status_code == 200:
# 解析HTML
soup = BeautifulSoup(response.text, 'lxml')
# 找到年报下载链接或者正文部分(这取决于API返回的数据结构)
annual_report = soup.find('a', {'data-report-type': 'annual'})
if annual_report:
report_url = annual_report['href']
# 下载年报文本
with requests.get(report_url, stream=True) as report_response:
if report_response.status_code == 200:
txt_content = report_response.text
# 将文本内容保存为.txt文件
with open(f"{stock_code}_2023_annual_report.txt", 'w', encoding='utf-8') as file:
file.write(txt_content)
print(f"年度报告已保存为{file.name}")
else:
print("年报信息未找到")
else:
print(f"请求失败,状态码:{response.status_code}")
阅读全文