用python爬取网页http://124.95.133.164/work/xjlp/new_building.jsp到表格
时间: 2023-11-16 09:05:18 浏览: 75
好的,可以使用Python中的requests和BeautifulSoup库来实现网页爬取和数据提取。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 发送GET请求并获取网页内容
url = 'http://124.95.133.164/work/xjlp/new_building.jsp'
response = requests.get(url)
html = response.content
# 使用BeautifulSoup解析网页内容并提取表格数据
soup = BeautifulSoup(html, 'html.parser')
table = soup.find('table', {'class': 'table'})
rows = table.find_all('tr')
data = []
for row in rows:
cols = row.find_all('td')
cols = [col.text.strip() for col in cols]
data.append(cols)
# 将数据保存到DataFrame中并输出到控制台
df = pd.DataFrame(data)
print(df)
```
这段代码会将从网页中提取的表格数据保存到一个DataFrame中,并输出到控制台。你可以根据需要对输出格式进行调整。
阅读全文