如何获取网站全部table中部分元素存到Excel表格中
时间: 2024-02-26 19:52:52 浏览: 20
要获取网站中全部table中的部分元素,并将其存储到Excel表格中,可以使用Python中的pandas库和BeautifulSoup库进行操作。下面给出一个简单的代码示例:
```python
import requests
import pandas as pd
from bs4 import BeautifulSoup
url = 'http://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
tables = soup.find_all('table') # 查找网页中的全部table元素
dfs = [] # 用于存储所有的DataFrame数据
for table in tables:
# 假设要存储每个table中的第1列和第3列数据
df = pd.read_html(str(table), usecols=[0, 2])[0] # 读取每个table元素的第1列和第3列数据,并转换为DataFrame数据
dfs.append(df)
with pd.ExcelWriter('example.xlsx') as writer:
for i, df in enumerate(dfs):
df.to_excel(writer, sheet_name=f'table_{i+1}', index=False) # 将每个DataFrame数据存储到Excel表格中,每个sheet的名称为table_i(i从1开始)
```
其中,使用BeautifulSoup库查找网页中的全部table元素,并使用pd.read_html()方法将每个table元素的第1列和第3列数据读取,并转换为DataFrame数据。将所有的DataFrame数据存储在dfs列表中,最后使用pd.ExcelWriter()方法将每个DataFrame数据存储到Excel表格中,每个sheet的名称为table_i(i从1开始)。