首页BeautifulSoup用法

BeautifulSoup用法

时间: 2023-12-14 22:02:18 浏览: 84

BeautifulSoup是Python的一个HTML或XML解析库，它可以将HTML或XML文档解析成树形结构，方便我们对文档进行操作。使用BeautifulSoup需要先安装，可以通过pip命令进行安装，如下所示： ``` pip install beautifulsoup4 ``` 安装完成后，我们可以导入BeautifulSoup类，并使用它来解析HTML或XML文档，如下所示： ```python from bs4 import BeautifulSoup # 解析HTML文档 html = """ <html> <head> <title>BeautifulSoup用法</title> </head> <body> <div class="content"> <p>这是一个段落</p> <ul> <li>列表项1</li> <li>列表项2</li> <li>列表项3</li> </ul> </div> </body> </html> """ soup = BeautifulSoup(html, 'html.parser') # 获取标题 title = soup.title.string print(title) # 获取段落内容 p = soup.find('p') print(p.string) # 获取列表项 lis = soup.find_all('li') for li in lis: print(li.string) ``` 在上面的示例中，我们使用BeautifulSoup解析了一个HTML文档，并获取了标题、段落内容和列表项。其中，find方法可以根据标签名查找元素，find_all方法可以查找所有符合条件的元素。另外，string属性可以获取元素的文本内容。

阅读全文