如何用pandas爬取网页数据
时间: 2024-05-17 12:13:41 浏览: 96
Python基于pandas爬取网页表格数据
5星 · 资源好评率100%
要用 Pandas 爬取网页数据,可以通过 Pandas 的 read_html() 函数来实现。它可以直接读取 HTML 表格数据,并转化为 Pandas 的 DataFrame 对象。
以下是一个示例代码,演示如何获取指定 URL 中的 HTML 表格数据:
```python
import pandas as pd
url = 'http://example.com/table.html'
table = pd.read_html(url)
# 获取第一个表格数据
df = table[0]
# 输出前 5 行数据
print(df.head())
```
需要注意的是,该方法只能读取 HTML 中的表格数据,如果需要爬取其他类型数据,还需要其他的方法。
阅读全文