beautifulsoup4怎么读
时间: 2023-06-17 08:07:05 浏览: 135
beautifulsoup4-4.1.2.tar
您好,beautifulsoup4是Python中一个非常流行的HTML/XML解析库,用于从HTML或XML文档中提取数据。使用以下命令安装beautifulsoup4:
```
pip install beautifulsoup4
```
安装完成后,您可以在Python脚本中导入beautifulsoup4并开始使用它。例如,以下代码演示了如何使用beautifulsoup4解析HTML文档:
```python
from bs4 import BeautifulSoup
html_doc = """
<html>
<head>
<title>My webpage</title>
</head>
<body>
<p class="my-paragraph">This is a paragraph.</p>
<ul>
<li>Item 1</li>
<li>Item 2</li>
<li>Item 3</li>
</ul>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
# 找到页面标题
print(soup.title.string)
# 找到第一个段落
print(soup.p.string)
# 找到所有列表项
for li in soup.find_all('li'):
print(li.string)
```
输出如下:
```
My webpage
This is a paragraph.
Item 1
Item 2
Item 3
```
希望这能帮助您开始使用beautifulsoup4库。
阅读全文