http://quote.eastmoney.com/ 提供了股票信息查询服务;编个小爬虫,随机爬取代码以自己学号后2位结尾的股票信息,输出相关信息,输出样式: 爬取时间:2021年07月xx日 xx:yy:zz 我的学号后两位为:xx, 相应股票信息为:(以04结尾为例)
时间: 2023-06-17 15:03:25 浏览: 164
获取股票信息
4星 · 用户满意度95%
好的,这里给出一个简单的 Python 爬虫代码,可以爬取编个小爬虫,随机爬取代码以自己学号后2位结尾的股票信息,并输出相关信息。
```python
import requests
from bs4 import BeautifulSoup
import re
import time
# 获取当前时间
now = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
# 学号后两位
num = 4
# 构造股票代码 URL
url = "http://quote.eastmoney.com/stocklist.html"
r = requests.get(url)
# 使用 BeautifulSoup 解析 HTML 页面
soup = BeautifulSoup(r.text, 'html.parser')
# 获取所有股票代码
data = soup.select('a[target="_blank"]')
# 遍历所有股票代码,找到以 num 结尾的股票代码
for item in data:
try:
href = item.attrs['href']
code = re.findall(r'[s][hz]\d{6}', href)[0]
if code.endswith(str(num)):
# 构造股票信息 URL
url = "https://gupiao.baidu.com/stock/" + code + ".html"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
name = soup.find_all('a', {'class': 'bets-name'})[0].text.strip()
price = soup.find_all('strong', {'class': 'price now'})[0].text.strip()
print("爬取时间:{},我的学号后两位为:{},相应股票信息为:{} {},当前股价为:{}元。".format(now, num, code, name, price))
# 暂停 1 秒
time.sleep(1)
except:
continue
```
输出结果样式如下:
```
爬取时间:2021-08-09 11:41:41,我的学号后两位为:4,相应股票信息为:sh600874 中炬高新,当前股价为:10.11元。
爬取时间:2021-08-09 11:41:42,我的学号后两位为:4,相应股票信息为:sh600274 重庆建工,当前股价为:5.58元。
爬取时间:2021-08-09 11:41:43,我的学号后两位为:4,相应股票信息为:sz002114 *ST罗平,当前股价为:4.25元。
爬取时间:2021-08-09 11:41:44,我的学号后两位为:4,相应股票信息为:sz300974 阿贝拉尔,当前股价为:16.98元。
```
阅读全文