python数据采集案例
时间: 2023-07-25 22:33:42 浏览: 162
一个简单的 Python 数据采集案例是获取网站上的股票数据。以下是基本的步骤:
1. 导入必要的库,如 requests 和 BeautifulSoup。
2. 使用 requests 库获取网页 HTML。
3. 使用 BeautifulSoup 解析 HTML,并找到包含股票数据的元素。
4. 提取股票数据并存储到一个列表中。
5. 可以将数据存储到本地文件或数据库中。
以下是一个示例代码,用于从东方财富网获取股票数据:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://quote.eastmoney.com/stocklist.html'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取所有股票的代码和名称
stocks = soup.select('.quotebody ul li a')
for stock in stocks:
code = stock['href'].split('/')[-1][:-5]
name = stock.text
print(code, name)
# 获取单个股票的实时数据
stock_code = 'sh601006'
url = 'http://hq.sinajs.cn/list=' + stock_code
response = requests.get(url)
data = response.text.split(',')
name = data[0][data[0].index('"')+1:]
price = data[3]
print(name, price)
```
该代码首先从东方财富网获取所有股票的代码和名称,然后使用股票代码获取单个股票的实时数据。最后打印股票名称和当前价格。
阅读全文