http://finance.sina.com.cn/fund/quotes/400015/bc.shtml,从中爬取基金历史净值
时间: 2023-08-07 12:06:09 浏览: 171
要从给定的网页链接中爬取基金的历史净值,您可以使用以下代码:
```python
import requests
from bs4 import BeautifulSoup
# 设置基金代号
fund_code = '400015'
# 构造爬取链接
url = f'http://finance.sina.com.cn/fund/quotes/{fund_code}/bc.shtml'
# 发送请求
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取历史净值表格
table = soup.find('table', class_='tblFund')
# 获取表格中的行数据
rows = table.find_all('tr')
# 遍历每行数据,跳过表头
for row in rows[1:]:
# 获取每行中的列数据
cols = row.find_all('td')
# 获取日期和净值
date = cols[0].text
net_value = cols[1].text
# 打印日期和净值
print(f'日期:{date},净值:{net_value}')
```
这段代码使用了与之前不同的网站链接,然后发送了HTTP请求。接着,使用BeautifulSoup解析HTML,并找到包含历史净值的表格。之后,遍历表格的每一行,并提取日期和净值信息,最后将它们打印出来。
请注意,根据网站的具体结构和更新情况,您可能需要进一步调整代码以正确提取历史净值。请仔细查看网页的HTML源代码,并根据需要更新选择器和其他代码部分。同样,爬取网站数据时,请遵守网站的使用规则和法律法规。
阅读全文