用python写一个爬取网页表格内容的代码
时间: 2023-06-03 10:04:49 浏览: 220
python 爬取网页
好的,我可以为您提供关于Python爬取网页表格内容的代码。
您可以使用beautifulsoup4库来获取网页的html内容,然后从中提取表格。下面是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
# 发送请求获取页面html
url = "http://www.example.com/table"
response = requests.get(url)
html = response.content
# 用beautifulsoup解析html
soup = BeautifulSoup(html, 'html.parser')
# 找到表格
table = soup.find('table')
# 打印表格内容
for row in table.find_all('tr'):
row_data = []
for cell in row.find_all('td'):
row_data.append(cell.text.strip())
print(row_data)
```
这个代码可以爬取一个名为“table”的网页表格,并打印出表格的所有行和列。
希望这能帮到您!
阅读全文