python中scrapy如何只爬数字部分
时间: 2024-06-10 11:06:52 浏览: 9
你好!请问您有什么问题需要我帮忙吗?
关于您的问题,可以使用xpath或者正则表达式来提取数字部分。具体的做法可以参考以下代码:
使用正则表达式:
```python
import re
import scrapy
class MySpider(scrapy.Spider):
name = 'example.com'
start_urls = ['http://www.example.com/']
def parse(self, response):
# 使用正则表达式提取数字
numbers = re.findall('\d+', response.body_as_unicode())
print(numbers)
```
使用xpath:
```python
import scrapy
class MySpider(scrapy.Spider):
name = 'example.com'
start_urls = ['http://www.example.com/']
def parse(self, response):
# 使用xpath提取数字
numbers = response.xpath('//text()[normalize-space() and translate(., "0123456789", "") = ""')
print(numbers.extract())
```
希望以上代码可以帮助到你,如有其他问题,请随时联系我。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)