爬取豆瓣读书top250保存到mysql完整代码

以下是爬取豆瓣读书top250并将数据保存到MySQL数据库的完整代码： ```python import requests from bs4 import BeautifulSoup import pymysql # 连接MySQL数据库 db = pymysql.connect(host='localhost', user='root', password='password', database='douban', port=3306) cursor = db.cursor() # 创建表格 create_table_sql = """ CREATE TABLE IF NOT EXISTS `book` ( `id` int(11) NOT NULL AUTO_INCREMENT, `title` varchar(255) DEFAULT NULL, `author` varchar(255) DEFAULT NULL, `score` float DEFAULT NULL, `comment_num` int(11) DEFAULT NULL, `url` varchar(255) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; """ cursor.execute(create_table_sql) # 爬取豆瓣读书top250 for i in range(0, 250, 25): url = f'https://book.douban.com/top250?start={i}' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'html.parser') book_list = soup.find('div', class_='article').find_all('table') # 解析每一本书的信息并保存到数据库 for book in book_list: title = book.find('div', class_='pl2').find('a')['title'] author = book.find('p', class_='pl').get_text() score = book.find('span', class_='rating_nums').get_text() comment_num = book.find('span', class_='pl').get_text().split()[1].strip('()') url = book.find('div', class_='pl2').find('a')['href'] # 插入数据到MySQL数据库 insert_sql = f"INSERT INTO `book` (`title`, `author`, `score`, `comment_num`, `url`) VALUES ('{title}', '{author}', {score}, {comment_num}, '{url}')" try: cursor.execute(insert_sql) db.commit() print(f"{title} 保存成功") except Exception as e: db.rollback() print(f"{title} 保存失败，错误信息：{e}") # 关闭数据库连接 db.close() ``` 注意： 1. 需要将代码中的数据库连接信息改为自己的实际信息。 2. 该代码使用的是豆瓣读书top250的网页结构，如果网页结构有改变，需要相应地修改代码。 3. 插入数据到MySQL数据库时使用的是字符串拼接方式，存在SQL注入的风险，建议使用参数化查询来避免此风险。

阅读全文

爬取豆瓣读书top250保存到mysql完整代码

相关推荐

【python-爬虫】爬豆瓣top250，存入mysql数据库

【爬虫高阶】豆瓣读书数据存入Mysql数据库

爬取豆瓣读书top250保存到mysql，运行效果图

Scrapy爬取豆瓣读书Top250

利用Scrapy框架爬取豆瓣读书Top250详细信息

python爬取豆瓣Top250电影保存到mysql数据库代码

用python爬取豆瓣读书top250，把这些爬取到的数据，使用mysql语句存取到本地数据库

python爬取豆瓣电影top250到mysql

python爬虫爬取豆瓣音乐top250完整代码并连接MySQL数据库

爬取豆瓣电影Top250.zip

爬取豆瓣电影top250和爬取当当网数据

爬取豆瓣电影Top250+爬取知乎专栏文章标题

Go-Golang爬虫爬取豆瓣电影Top250

爬取豆瓣电影Top250中的电影信息以及保存相关的数据信息

用python爬虫爬取豆瓣电影top250的信息

python爬虫爬取豆瓣音乐top250完整代码并连接MySQL数据库实现词云图可视化

Python爬取豆瓣Top250并存储至mysql数据库

爬取豆瓣电影top250的电影数据并存入数据库代码

python爬取豆瓣电影top250 + 数据可视化

最新推荐

数学建模学习资料 姜启源数学模型课件 M04 数学规划模型 共85页.pptx

【大越期货-2024研报】生猪期货早报.pdf

JHU荣誉单变量微积分课程教案介绍

管理建模和仿真的文件

【实战篇：自定义损失函数】：构建独特损失函数解决特定问题，优化模型性能

如何在ZYNQMP平台上配置TUSB1210 USB接口芯片以实现Host模式，并确保与Linux内核的兼容性？

Naruto爱好者必备CLI测试应用

"互动学习：行动中的多样性与论文攻读经历"

【强化学习损失函数探索】：奖励函数与损失函数的深入联系及优化策略

如何在Springboot后端项目中实现前端的多人视频会议功能，并使用Vue.js与ElementUI进行界面开发？

数学建模学习资料姜启源数学模型课件 M04 数学规划模型共85页.pptx