开发诗词名句网爬虫与展示系统
版权申诉
14 浏览量
更新于2024-11-05
收藏 975KB ZIP 举报
资源摘要信息:"本项目是一个关于诗词名句网爬虫代码开发的详细方案。主要分为爬虫端和展示端两大部分。爬虫端的目标是获取诗词名句网上的13033位诗人的信息及作品,包括个人简介和所有作品。存储方式是通过flask_sqlalchemy存储到mysql数据库中。展示端包括前端和后端,前端负责接收用户输入,并进行搜索过滤,支持特定搜索语法,如按诗人或诗句搜索。展示方式可以使用模态窗或者跳转页面。后端则处理业务逻辑,主要是搜索功能,根据前端传回的值查询数据库。本项目需要设计两张表:一张是诗人表,一张是诗词表。"
知识点:
1. 网络爬虫:网络爬虫是一种自动化获取网页内容的程序,通常用于搜索引擎的索引、数据挖掘等领域。本项目中,爬虫的目标是获取诗词名句网上的诗人信息及作品。
2. 数据库存储:mysql是一种关系型数据库,通过flask_sqlalchemy存储数据,可以方便地进行数据的增删改查操作。
3. 前端设计:前端设计包括搜索页面的设计,需要支持用户输入过滤和搜索。搜索语法支持按诗人搜索和按诗句搜索。展示方式可以使用模态窗或者跳转页面。
4. 后端设计:后端处理业务逻辑,主要是搜索功能,根据前端传回的值查询数据库。后端还需要配合pyecharts展示柱状图,展示诗人的诗数量前十。
5. 数据表设计:本项目需要设计两张表:一张是诗人表,用于存储诗人的信息,包括姓名、年代、简介等字段;一张是诗词表,用于存储诗词的信息,包括诗词名称、诗词内容、解析等字段。
6. 搜索功能实现:搜索功能是本项目的核心,需要能够处理用户的各种输入,包括特定的搜索语法,并能返回正确的搜索结果。
7. 柱状图展示:通过pyecharts,可以将数据以柱状图的形式展示出来,本项目中,可以展示诗人的诗数量前十的柱状图。
8. 网站信息获取:通过爬虫获取网站信息,需要对网站的结构有足够的了解,以便能够准确获取需要的数据。
2024-12-09 上传
2024-05-31 上传
210 浏览量
127 浏览量
118 浏览量
136 浏览量
347 浏览量
2021-10-11 上传
小小哭包
- 粉丝: 2089
- 资源: 4286
最新资源
- 格式转换工具,视频,音频类互相无损转换
- 雅马哈本
- 基于Jetty+Servlet+Jsp+MySQL+MyBatis技术实现的简单博客系统
- plant-help:我需要跟踪何时在家浇水
- EXP1_ngc.rar
- docker-angular:带有节点14的Docker上的Angular 11.2.9
- biketracking:BikeTracking是一个Android应用程序,用于跟踪您的自行车活动
- 基于PCA算法的图像融合matlab源码
- MiniGameOne:Minigame Apple Road Unity 3D
- 汉王唐人笔TR-TP618手写板驱动程序 官方版
- diospratama.github.io
- 维控电子HMI互锁的应用例子.rar
- EDU:一个包含我公开的项目,任务和其他作品的回购
- 用u-ns检查
- 测量目标之间的距离
- 黑苹果MAC变频查看,Hackintosh查看CPU频率的软件---Intel Power Gadget v3.0.3