利用beautifulsoup4爬取网页http://vip.stock.finance.sina.com.cn/corp/go.php/vFD_BalanceSheet/stockid/000568/ctrl/part/displaytype/4.phtml中BalanceSheetNewTable0 > tbody表格的内容并利用panda库将其内容存储到excel表格中,代码要添加注释
时间: 2023-08-22 14:09:18 浏览: 169
```
# 导入所需的库
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 指定要爬取的网页的 URL
url = "http://vip.stock.finance.sina.com.cn/corp/go.php/vFD_BalanceSheet/stockid/000568/ctrl/part/displaytype/4.phtml"
# 发送 GET 请求并获取响应
response = requests.get(url)
# 解析响应的 HTML 内容
soup = BeautifulSoup(response.content, "html.parser")
# 找到 BalanceSheetNewTable0 > tbody 标签
balance_table = soup.find("table", {"id": "BalanceSheetNewTable0"}).find("tbody")
# 找到所有的行(tr)和列(td)
rows = balance_table.find_all("tr")
data = []
for row in rows:
cols = row.find_all("td")
cols = [col.text.strip() for col in cols]
data.append(cols)
# 将数据转换为 Panda 的 DataFrame 格式
df = pd.DataFrame(data)
# 将 DataFrame 写入到 Excel 文件中
df.to_excel("balance_sheet.xlsx", index=False, header=False)
```
注释已添加,主要解释了爬取数据的过程和将数据存储到 Excel 文件中的方法。
阅读全文
相关推荐
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)