用bs4爬取唐诗中的五言绝句
时间: 2024-05-09 13:20:14 浏览: 22
以下是使用Python和BeautifulSoup4库爬取唐诗中的五言绝句的示例代码:
```
import requests
from bs4 import BeautifulSoup
# 请求URL
url = 'https://so.gushiwen.cn/mingju/Default.aspx?p=1&c=%E4%BA%94%E8%A8%80%E7%BB%9D%E5%8F%A5'
# 发送HTTP请求
response = requests.get(url)
# 解析HTML文档
soup = BeautifulSoup(response.text, 'html.parser')
# 获取所有五言绝句的标签
poems = soup.find_all('div', class_='sons')
# 遍历每个五言绝句标签,输出诗句和作者
for poem in poems:
# 获取诗句和作者
content = poem.find('div', class_='contson').text.strip()
author = poem.find('p', class_='source').find_all('a')[1].text.strip()
# 判断是否为五言绝句
if len(content) == 10:
print(content)
print('——' + author)
```
该代码会输出第一页中所有的五言绝句和作者。可以通过修改URL中的页码和诗句类型参数来爬取其他页的数据或其他类型的诗句。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)