<img data-src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg" class=" lazyloaded" data-large-alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B" alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B, thumbnail 1" src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg"> python编程爬取这段代码里的src
时间: 2024-04-10 18:34:01 浏览: 99
Semi-Supervised-CNN-for-Sentiment-Analysis.zip_https//semi.CNN_l
要爬取这段代码中的`src`属性,您可以使用Python中的正则表达式或者使用第三方库如BeautifulSoup来解析HTML。
以下是使用正则表达式的示例代码:
```python
import re
code = '<img data-src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg" class=" lazyloaded" data-large-alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B" alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B, thumbnail 1" src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg">'
src = re.search(r'src="([^"]+)"', code).group(1)
print(src)
```
这段代码将会输出`/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg`,即`src`属性中的值。
如果您想使用BeautifulSoup来解析HTML,可以使用以下代码:
```python
from bs4 import BeautifulSoup
code = '<img data-src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg" class=" lazyloaded" data-large-alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B" alt="LG Tapis de souris de jeu UltraGear<sup>MC</sup> de LG, Vue du dessus du côté supérieur avec éclairage RVB, UGP90HB-B, thumbnail 1" src="/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg">'
soup = BeautifulSoup(code, 'html.parser')
img_tag = soup.find('img')
src = img_tag['src']
print(src)
```
这段代码也会输出`/ca_fr/images/lg-gram/md07570331/gallery/D-01.jpg`。
请根据您的需求选择适合您的方法来解析HTML代码并获取`src`属性的值。
阅读全文