正则表达式获取a标签
时间: 2023-11-12 20:58:59 浏览: 41
可以使用以下正则表达式来获取a标签:
```python
import re
html = '<a href="https://www.example.com">Example</a>'
pattern = r'<a.*?href="(.*?)".*?>(.*?)</a>'
match = re.search(pattern, html)
if match:
url = match.group(1)
text = match.group(2)
print(url, text)
```
输出:
```
https://www.example.com Example
```
相关问题
js正则表达式获取a标签
可以使用正则表达式来获取a标签,具体的正则表达式如下所示:
```javascript
/<a[^>]*href=['"]([^'"]+)['"][^>]*>(.*?)<\/a>/gi
```
其中,`[^>]*`表示匹配除了`>`以外的任意字符,`[^'"]+`表示匹配除了单引号和双引号以外的任意字符,`.*?`表示匹配任意字符,但是尽可能少地匹配。
下面是一个示例代码:
```javascript
const html = '<a href="https://www.baidu.com">百度</a><a href="https://www.google.com">谷歌</a>';
const regex = /<a[^>]*href=['"]([^'"]+)['"][^>]*>(.*?)<\/a>/gi;
let match;
while ((match = regex.exec(html)) !== null) {
console.log(match[1], match[2]);
}
```
输出结果为:
```
https://www.baidu.com 百度
https://www.google.com 谷歌
```
正则表达式获取href
正则表达式获取href是一种常见的网页爬虫技术,可以通过正则表达式匹配网页中的链接地址。在Python中,可以使用re模块中的findall方法来实现正则表达式匹配。具体实现方法如下:
import re
url_regex = re.compile('<a[^>]+href=["\'](.*?)["\']', re.IGNORECASE)
result = url_regex.findall(html_str)
其中,url_regex是一个正则表达式对象,用于匹配网页中的链接地址。findall方法会返回一个列表,其中包含了所有匹配到的链接地址。在这个例子中,我们使用了一个通用的正则表达式,可以匹配所有的a标签中的href属性。如果需要匹配其他类型的链接,可以根据实际情况修改正则表达式。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)