Python 中怎么使用 Scrapy 爬虫
时间: 2024-04-20 10:09:00 浏览: 79
使用 Scrapy 爬虫框架可以帮助你快速地构建一个爬虫程序。下面是一个简单的 Scrapy 爬虫程序的示例:
```python
import scrapy
class MySpider(scrapy.Spider):
name = 'myspider'
start_urls = ['http://example.com']
def parse(self, response):
# 在这里编写解析响应的代码
pass
```
在这个示例中,我们定义了一个名为 `MySpider` 的爬虫,它会从 `start_urls` 中指定的 URL 开始爬取。在 `parse` 方法中,我们可以编写解析响应的代码,例如提取网页中的数据。
要运行这个爬虫,你可以在命令行中使用以下命令:
```
scrapy runspider myspider.py
```
这样,Scrapy 就会开始运行 `MySpider` 爬虫,爬取 `start_urls` 中指定的网页并解析响应。你可以根据自己的需求来编写更加复杂的 Scrapy 爬虫程序。
阅读全文