python爬虫爬table
时间: 2023-10-09 21:15:33 浏览: 96
你可以使用Python的爬虫库(如requests和BeautifulSoup)来爬取网页上的表格数据。下面是一个简单的示例代码,可以帮助你开始爬取表格数据:
```python
import requests
from bs4 import BeautifulSoup
# 发送请求获取网页内容
url = 'https://example.com/table.html' # 替换为目标网页的URL
response = requests.get(url)
html = response.text
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html, 'html.parser')
# 找到目标表格(根据表格的选择器进行定位,比如使用class选择器)
table = soup.select('.table-class')[0] # 替换为目标表格的选择器
# 遍历表格行,并提取数据
for row in table.select('tr'):
# 遍历行中的单元格,并打印数据
cells = row.select('td')
if len(cells) > 0:
for cell in cells:
print(cell.text)
print('---') # 分隔符,可根据需要自行调整
```
请确保替换`url`变量为你想要爬取的网页的URL,并根据目标表格的HTML结构修改选择器(`.table-class`)以正确地定位表格。
阅读全文