使用python,不用正则表达式,不用beautifulsoul,字符串为<table><![cdata[abc]]></table> 如何获取标签table和内容abc
时间: 2024-09-19 14:16:41 浏览: 39
在Python中,如果你想要从这样的字符串中提取`<table>`标签及其内部的内容`abc`,可以使用标准库的`html.parser`模块。这是一个简单的例子:
```python
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
if data.startswith('<table'):
self.in_table = True
elif data.startswith('</table>') and self.in_table:
self.table_content = ''.join(self.table_content)
print(f"Table content: {self.table_content}")
self.in_table = False
self.table_content = []
def handle_starttag(self, tag, attrs):
if tag == 'table':
self.table_content = []
parser = MyHTMLParser()
parser.feed('<table><![CDATA[abc]]></table>')
```
这个解析器会查找`<table>`开始标签,并在其后积累数据直到遇到`</table>`结束标签。当找到`</table>`时,它会打印出之前积累的内容。