用pycharm爬取格力电器财务报表数据的代码,并储存到excel文件里
时间: 2024-03-30 15:34:16 浏览: 81
以下是一个示例代码,可以使用 Pycharm 爬取格力电器财务报表数据,并将数据储存到 Excel 文件中。
```python
import requests
import openpyxl
from bs4 import BeautifulSoup
# 设置爬取的年份和报表类型
year = "2020"
report_type = "balancesheet"
# 构造 URL
url = f"https://vip.stock.finance.sina.com.cn/corp/go.php/vFD_{report_type}/stockid/000651/displaytype/4/{year}/orderby/stockid/order/asc/page/1.phtml"
# 发送 HTTP 请求,并获取响应内容
response = requests.get(url)
html = response.content
# 解析 HTML 页面
soup = BeautifulSoup(html, "html.parser")
# 找到数据表格
table = soup.find("table", class_="list_table")
# 创建一个新的 Excel 工作簿
workbook = openpyxl.Workbook()
# 在工作簿中创建一个新的工作表
worksheet = workbook.active
# 遍历表格的每一行和每一列,将数据写入 Excel 工作表中
for row_index, row in enumerate(table.find_all("tr")):
for column_index, column in enumerate(row.find_all("td")):
cell_value = column.text.strip()
worksheet.cell(row=row_index+1, column=column_index+1, value=cell_value)
# 将工作簿保存到本地文件
workbook.save("格力电器财务报表.xlsx")
```
这个示例代码中,首先构造了一个 URL,然后发送 HTTP 请求,获取响应内容并解析 HTML 页面。接着用 openpyxl 库创建了一个新的 Excel 工作簿,并在工作簿中创建了一个新的工作表。最后,遍历数据表格的每一行和每一列,将数据写入 Excel 工作表中,并将工作簿保存到本地文件。
阅读全文