python爬取双色球
时间: 2023-10-04 11:11:15 浏览: 142
可以使用Python的requests和BeautifulSoup库来爬取双色球的开奖数据。
首先,需要确定要爬取的网站,例如双色球开奖结果可以在中国福利彩票官网上查看:http://www.cwl.gov.cn/kjxx/ssq/kjgg/.
接下来,可以使用requests库向该网站发送HTTP请求,获取网页内容。代码如下:
```python
import requests
url = 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/'
response = requests.get(url)
html = response.text
```
然后,可以使用BeautifulSoup库解析HTML文档,提取需要的信息。例如,双色球的开奖结果可以在HTML文档中的`<tbody>`标签中找到。代码如下:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'html.parser')
tbody = soup.find('tbody')
```
接着,可以遍历`<tbody>`标签中的每一行,提取开奖日期和号码等信息。代码如下:
```python
for tr in tbody.find_all('tr'):
tds = tr.find_all('td')
date = tds[0].text.strip() # 开奖日期
nums = [td.text for td in tds[1:7]] # 开奖号码
red, blue = nums[:6], nums[6] # 红球和蓝球
print(date, red, blue)
```
完整代码如下:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
tbody = soup.find('tbody')
for tr in tbody.find_all('tr'):
tds = tr.find_all('td')
date = tds[0].text.strip() # 开奖日期
nums = [td.text for td in tds[1:7]] # 开奖号码
red, blue = nums[:6], nums[6] # 红球和蓝球
print(date, red, blue)
```
运行代码后,可以看到输出了双色球的开奖结果。
阅读全文