用python写段获取网页表格的代码
时间: 2023-05-25 16:06:05 浏览: 51
以下是一个示例,可以使用Python中的BeautifulSoup库和requests库来获取HTML页面中的表格数据:
```Python
import requests
from bs4 import BeautifulSoup
url = 'http://www.example.com'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
table_html = soup.find('table', attrs={'class': 'table_class'}) # 表格HTML代码
table_data = [] # 存储表格数据的数组
rows = table_html.find_all('tr') # 获取所有行
for row in rows:
cols = row.find_all('td') # 获取所有单元格
cols = [col.text.strip() for col in cols] # 删除单元格中的空格
table_data.append(cols) # 将每一行的数据存储到数组中
print(table_data) # 输出表格数据
```
这个示例首先使用requests库获取一个网页的HTML代码。然后,使用BeautifulSoup库将HTML代码解析为一个soup对象。接下来,查找包含表格的HTML代码并将其存储在table_html变量中。最后,通过迭代表格的行和单元格,将每行的数据存储到一个数组中。