pixiv上爬取图片存到mariadb数据库

要实现这个功能，你需要掌握以下技能： 1. Python 爬虫技术 2. Mariadb 数据库操作技术下面是一个简单的步骤： 1. 安装 Python 客户端和 Mariadb 数据库。 2. 在 Mariadb 中创建一个名为 pixiv 的数据库，然后创建一个名为 images 的表，该表包含以下字段：id（自增长）、title、url、tags 和创建时间。你可以使用如下 SQL 语句进行创建： ``` CREATE DATABASE IF NOT EXISTS pixiv; USE pixiv; CREATE TABLE IF NOT EXISTS images ( id INT UNSIGNED NOT NULL AUTO_INCREMENT, title VARCHAR(100) NOT NULL, url VARCHAR(255) NOT NULL, tags VARCHAR(255) DEFAULT '', created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (id) ); ``` 3. 安装必要的 Python 库，包括 requests 和 pymysql 库。 4. 编写 Python 爬虫代码。你可以使用 requests 库获取 Pixiv 网站上的图片信息，然后将相关信息存储到 Mariadb 数据库中。下面是一个示例代码： ``` import requests import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='root', password='password', database='pixiv') # 获取图片信息 url = 'https://www.pixiv.net/ajax/search/artworks/%E7%8C%AB%E3%80%80OR%E3%83%8D%E3%82%B3?word=%E7%8C%AB%E3%80%80OR%E3%83%8D%E3%82%B3&order=date_d&mode=all&p=1&s_mode=s_tag&type=all' headers = { 'Referer': 'https://www.pixiv.net/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) json_data = response.json() works = json_data['body']['illustManga']['data'] # 将图片信息存储到数据库中 for work in works: title = work['title'] url = work['url'] tags = ','.join(work['tags']) cursor = conn.cursor() sql = "INSERT INTO images (title, url, tags) VALUES (%s, %s, %s)" cursor.execute(sql, (title, url, tags)) conn.commit() cursor.close() # 关闭数据库连接 conn.close() ``` 5. 运行 Python 爬虫代码，将图片信息存储到 Mariadb 数据库中。以上就是将 Pixiv 上的图片信息存储到 Mariadb 数据库的简单步骤。当然，你可以根据自己的需求进行更改和优化。

阅读全文

pixiv上爬取图片存到mariadb数据库

相关推荐

Python爬虫库pixiv_crawler-0.0.4功能及安装教程

Vue技术打造的高效Pixiv阅览工具源码解析

Pixiv艺术作品放大预览脚本，关注用户高亮显示

Pixcrawl-Full:带有Selenium的python搜寻器，并要求在Pixiv上搜寻图片

基于Python Scrapy的Pixiv每日榜100爬虫设计源码

pixivblocker:阻止pixiv上的坏东西并翻录图像动画

pixiv-backend:cp-pixiv-backend

PixivPreview:在pixiv上显示artsmanga的放大预览并突出显示关注的用户

pixiv-creeper:按pid，按画师，按关注，按标签，按搜索，按榜爬。爬，都可以爬

Pixiv排名新标签「Pixiv Ranking New Tab」-crx插件

pixiv-search-filtering-helper:Greasemonkey 脚本帮助 pixiv 标签搜索

extractor.photo.pixiv.tbrl.js:pixiv提取程序修补程序的taberareloo

TypeScript_Chrome 扩展批量下载 Pixiv 的插画和小说过滤作品下载时重命名转换动态图片等Power.zip

Pixiv Art Downloader-crx插件

Koi Pixiv Extension-crx插件

Pixiv Ugoira WebM-crx插件

pixiv_follower_filter-crx插件

用Python写一个爬取pixiv网站图片的爬虫

nginx-pixiv

pixiv详细注册方式

最新推荐

基于net的超市管理系统源代码（完整前后端+sqlserver+说明文档+LW）.zip

LABVIEW程序实例-公式节点.zip

大米商城开源版damishop(适合外贸)

LABVIEW程序实例-通过全局变量接收数据.zip

LABVIEW程序实例-日历控件.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践