python爬虫存入excel
时间: 2023-08-27 07:06:21 浏览: 187
你可以使用Python中的库来进行爬虫并将数据存入Excel文件。下面是一个简单的示例:
```python
import requests
import xlwt
from bs4 import BeautifulSoup
# 发起网络请求并获取页面内容
url = 'http://example.com' # 替换为你要爬取的网页链接
response = requests.get(url)
html = response.text
# 使用BeautifulSoup解析页面内容
soup = BeautifulSoup(html, 'html.parser')
# 提取需要的数据
data = []
# 这里假设你要提取的数据在网页的<table>标签中
table = soup.find('table')
rows = table.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [col.text.strip() for col in cols]
data.append(cols)
# 创建Excel文件并写入数据
workbook = xlwt.Workbook()
sheet = workbook.add_sheet('Sheet1')
for i, row in enumerate(data):
for j, col in enumerate(row):
sheet.write(i, j, col)
# 保存Excel文件
workbook.save('data.xls')
```
这个示例使用`requests`库发送网络请求,然后使用`BeautifulSoup`库解析网页内容,最后使用`xlwt`库创建Excel文件并将数据写入其中。你需要根据具体的网页结构和数据提取方式进行调整。
阅读全文