python爬取古诗存到mysql
时间: 2023-07-07 17:44:03 浏览: 97
python 爬取古诗文存入mysql数据库的方法
好的,我可以为您提供一个简单的Python代码示例,演示如何爬取古诗并将它们存储到MySQL数据库中。以下是示例代码:
```python
import requests
from bs4 import BeautifulSoup
import mysql.connector
# 连接到MySQL数据库
mydb = mysql.connector.connect(
host="localhost",
user="yourusername",
password="yourpassword",
database="yourdatabase"
)
mycursor = mydb.cursor()
# 网页URL
url = "https://so.gushiwen.cn/gushi/tangshi.aspx"
# 发送HTTP请求
response = requests.get(url)
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 获取古诗列表
poems = soup.find_all('div', class_='cont')
# 循环遍历每首古诗并将它们插入到数据库中
for poem in poems:
title = poem.find('b').text.strip()
author = poem.find('p', class_='source').text.strip()
content = poem.find('div', class_='contson').text.strip()
sql = "INSERT INTO poems (title, author, content) VALUES (%s, %s, %s)"
val = (title, author, content)
mycursor.execute(sql, val)
mydb.commit()
# 关闭数据库连接
mycursor.close()
mydb.close()
```
在这个示例中,我们首先连接到MySQL数据库。然后,我们使用requests库发送HTTP请求,获取古诗网页的HTML。接下来,我们使用BeautifulSoup解析HTML,找到所有包含古诗的div元素。然后,我们循环遍历每一首古诗,并将它们的标题、作者和内容插入到MySQL数据库中。最后,我们关闭数据库连接。
请注意,您需要将代码中的“yourusername”,“yourpassword”和“yourdatabase”替换为您自己的MySQL数据库的用户名、密码和数据库名称。另外,您还需要安装mysql-connector-python库,以便从Python中连接到MySQL数据库。
希望这个示例代码能够帮助您开始爬取古诗并将它们存储到MySQL数据库中。
阅读全文