怎么爬取https://price.pcauto.com.cn/top/sales/s1-t3-y2022-m12.html和https://price.pcauto.com.cn/top/sales/s1-t3-y2021-m12.html中的表格
时间: 2023-12-18 13:04:36 浏览: 111
您可以使用Python中的requests和BeautifulSoup库来提取这些网页中的表格。
以下是一个示例代码,可以帮助您获取表格:
```python
import requests
from bs4 import BeautifulSoup
# 要爬取的网址
url1 = 'https://price.pcauto.com.cn/top/sales/s1-t3-y2022-m12.html'
url2 = 'https://price.pcauto.com.cn/top/sales/s1-t3-y2021-m12.html'
# 发送请求获取网页源代码
response1 = requests.get(url1)
response2 = requests.get(url2)
# 解析网页源代码
soup1 = BeautifulSoup(response1.text, 'html.parser')
soup2 = BeautifulSoup(response2.text, 'html.parser')
# 查找表格
table1 = soup1.find_all('table')[0]
table2 = soup2.find_all('table')[0]
# 处理表格数据
for row in table1.find_all('tr'):
# 处理表格行中的数据
for cell in row.find_all('td'):
print(cell.text)
for row in table2.find_all('tr'):
# 处理表格行中的数据
for cell in row.find_all('td'):
print(cell.text)
```
您可以根据自己的需求,进一步处理抽取的表格数据。
阅读全文