如何提取网页内容中"hierarchy": {******}的{}里面内容
时间: 2023-12-18 21:29:10 浏览: 145
可以使用正则表达式来提取网页内容中"hierarchy": {******}的{}里面内容。具体代码如下所示:
```python
import re
# 假设网页内容保存在html变量中
html = '网页内容'
# 使用正则表达式提取"hierarchy"字段中的内容
pattern = re.compile(r'"hierarchy": ({.*?})')
result = pattern.search(html).group(1)
# 输出提取的内容
print(result)
```
其中,正则表达式`'"hierarchy": ({.*?})'`表示匹配以`"hierarchy":`开头,后面跟着一个空格和一个左花括号`{`,然后匹配任意字符(非贪婪模式),直到遇到右花括号`}`为止。`group(1)`表示返回匹配到的第一个括号内的内容,即`{******}`。
阅读全文