fastapi布署爬虫
时间: 2024-04-18 21:20:50 浏览: 196
FastAPI是一个现代化的Python Web框架,它可以用于快速构建高性能的API。要在FastAPI中部署爬虫,你可以按照以下步骤进行操作:
1. 安装FastAPI和相关依赖:
```shell
pip install fastapi uvicorn httpx
```
2. 创建一个Python文件,例如`main.py`,并导入所需的模块:
```python
from fastapi import FastAPI
import httpx
import asyncio
```
3. 创建一个FastAPI应用实例:
```python
app = FastAPI()
```
4. 定义一个路由来处理爬虫请求:
```python
@app.get("/crawl")
async def crawl(url: str):
async with httpx.AsyncClient() as:
response = await client.get(url)
return response.text
```
在上述代码中,我们使用`httpx`库来发送异HTTP请求,并返回响应的文本内容。
5. 运行FastAPI应用:
```shell
uvicorn main:app --reload
```
现在,你可以通过访问`http://localhost:8000/crawl?url=<要爬取的URL>`来调用爬虫API,并获取响应的文本内容。
请注意,上述代码只是一个简单的示例,你可以根据自己的需求进行扩展和修改。另外,爬取网页时需要遵守网站的爬虫规则和法律法规。
阅读全文