利用Beautiful Soup库函数爬取上市公司财务报表,并将结果存储在excel文件中
时间: 2024-05-18 08:12:18 浏览: 143
以下是一个利用 Beautiful Soup 库函数爬取上市公司财务报表,并将结果存储在 Excel 文件中的示例代码:
```
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 设置请求头信息
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 请求网页数据
url = 'http://quotes.money.163.com/stock/f10/zycwzb_600519.html'
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.content, 'html.parser')
# 获取表格数据
table = soup.find_all('table')[3]
df = pd.read_html(str(table))[0]
# 存储为 Excel 文件
df.to_excel('data.xlsx')
```
在这个示例中,我们选择了网易财经的财务报表页面作为示例,你可以根据你所需要的数据来源进行修改。在获取到 HTML 内容后,我们使用 BeautifulSoup 库函数解析出表格数据,并将其转化为 Pandas 的 DataFrame 格式。最后,我们将 DataFrame 存储为 Excel 文件。
阅读全文