将python爬取数据转化为excel表格多个表头
时间: 2023-06-25 08:05:45 浏览: 180
Python基于pandas爬取网页表格数据
5星 · 资源好评率100%
要将Python爬取的数据转化为Excel表格,并带有多个表头,可以使用Python中的pandas库。
下面是一个简单的例子,假设我们已经爬取了一些数据,数据以列表的形式存储:
```python
data = [['John', 25, 'Male', 'USA'],
['Sarah', 30, 'Female', 'Canada'],
['Bob', 40, 'Male', 'UK']]
```
我们可以用pandas将数据转换为DataFrame对象:
```python
import pandas as pd
df = pd.DataFrame(data, columns=['Name', 'Age', 'Gender', 'Country'])
```
在这个例子中,我们定义了四个表头:Name、Age、Gender和Country。现在我们可以将这个DataFrame对象写入到Excel文件中:
```python
writer = pd.ExcelWriter('data.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Sheet1', index=False)
writer.save()
```
在这个例子中,我们使用了xlsxwriter引擎将数据写入到Excel文件中。我们还将sheet_name设置为'Sheet1',并将index设置为False,这样就不会在Excel文件中生成默认的索引列。
如果我们想要在Excel文件中包含多个表头,可以使用pandas的MultiIndex对象。例如,假设我们想要在Excel文件中包含两个表头:Name和Personal Information,可以使用以下代码:
```python
header = pd.MultiIndex.from_tuples([('Name', ''), ('Personal Information', 'Age'), ('Personal Information', 'Gender'), ('Personal Information', 'Country')])
df.columns = header
writer = pd.ExcelWriter('data.xlsx', engine='xlsxwriter')
df.to_excel(writer, sheet_name='Sheet1', index=False)
writer.save()
```
在这个例子中,我们首先使用MultiIndex对象定义了两个表头:Name和Personal Information,并在Personal Information表头下定义了三个子表头:Age、Gender和Country。然后,我们将这个MultiIndex对象赋值给DataFrame的columns属性,以更新DataFrame的表头。最后,我们将DataFrame写入到Excel文件中,并将sheet_name设置为'Sheet1'。
这样,我们就可以在Excel文件中看到两个表头了。
阅读全文