爬取一个单网页,并将爬取的内容输出到 excel内
时间: 2024-04-18 09:32:04 浏览: 11
你可以使用Python中的`requests`库来爬取网页内容,并使用`openpyxl`库将内容写入Excel文件。下面是一个示例代码:
```python
import requests
from openpyxl import Workbook
def crawl_website(url):
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
return None
def write_to_excel(content, filename):
workbook = Workbook()
sheet = workbook.active
sheet.title = "Website Content"
lines = content.split('\n')
for i, line in enumerate(lines):
sheet.cell(row=i+1, column=1, value=line)
workbook.save(filename)
# 替换为你要爬取的网页链接
url = 'https://example.com'
content = crawl_website(url)
if content:
write_to_excel(content, 'output.xlsx')
print("爬取并写入Excel成功!")
else:
print("无法访问网页或者网页不存在!")
```
在上面的代码中,`crawl_website`函数使用`requests`库发送HTTP请求并返回网页内容。然后,`write_to_excel`函数使用`openpyxl`库在Excel文件中写入内容。
你只需要将代码中的`url`变量替换为你要爬取的网页链接,然后运行代码,爬取的内容将保存在名为`output.xlsx`的Excel文件中。