Python爬取财经数据并保存为Excel文件
时间: 2024-01-13 19:04:29 浏览: 142
python爬取招聘网信息并保存为csv文件
Python爬取财经数据并保存为Excel文件,可以使用以下步骤:
1. 确定目标网站和要爬取的数据。可以使用requests库获取网页HTML代码,使用beautifulsoup库解析HTML代码,获取所需数据。
2. 将数据保存为pandas的DataFrame格式,方便进行数据清洗和处理。
3. 使用pandas的to_excel函数将数据保存为Excel文件。
以下是一个简单的示例代码,演示如何爬取新浪财经股票数据并保存为Excel文件:
```
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 获取网页HTML代码
url = 'http://finance.sina.com.cn/realstock/company/sh000001/nc.shtml'
response = requests.get(url)
html = response.content
# 解析HTML代码,获取股票数据
soup = BeautifulSoup(html, 'html.parser')
table = soup.find('table', {'id': 'FundHoldSharesTable'})
df = pd.read_html(str(table))[0]
# 保存数据到Excel文件
df.to_excel('sh000001.xlsx', index=False)
```
这段代码会爬取新浪财经上上证指数的股票数据,并保存到当前目录下的sh000001.xlsx文件中。在实际应用中,可以根据需要修改url和解析HTML代码的方法,来获取不同的财经数据。
阅读全文