python scrapy 爬虫实例
时间: 2023-06-09 13:06:18 浏览: 178
好的,Python Scrapy 爬虫实例可以是爬取网站的文章信息,如标题、作者、发布时间等并保存为json文件。以下是一个简单的爬虫实例:
```
import scrapy
class MySpider(scrapy.Spider):
name = "example"
start_urls = [
"http://www.example.com/articles/page1.html",
"http://www.example.com/articles/page2.html",
"http://www.example.com/articles/page3.html"
]
def parse(self, response):
for article in response.css('div.article'):
yield {
'title': article.css('a.title::text').get(),
'author': article.css('span.author::text').get(),
'date': article.css('span.date::text').get()
}
```
这段代码会从 `start_urls` 中的链接开始爬取对应网页中的文章信息,并将其保存到 json 文件中。爬虫可以通过 `scrapy runspider spider.py -o result.json` 命令运行,并将结果保存到 `result.json` 文件中。
阅读全文