开发诗词名句网爬虫与展示系统

版权申诉
0 下载量 7 浏览量 更新于2024-11-05 收藏 975KB ZIP 举报
资源摘要信息:"本项目是一个关于诗词名句网爬虫代码开发的详细方案。主要分为爬虫端和展示端两大部分。爬虫端的目标是获取诗词名句网上的13033位诗人的信息及作品,包括个人简介和所有作品。存储方式是通过flask_sqlalchemy存储到mysql数据库中。展示端包括前端和后端,前端负责接收用户输入,并进行搜索过滤,支持特定搜索语法,如按诗人或诗句搜索。展示方式可以使用模态窗或者跳转页面。后端则处理业务逻辑,主要是搜索功能,根据前端传回的值查询数据库。本项目需要设计两张表:一张是诗人表,一张是诗词表。" 知识点: 1. 网络爬虫:网络爬虫是一种自动化获取网页内容的程序,通常用于搜索引擎的索引、数据挖掘等领域。本项目中,爬虫的目标是获取诗词名句网上的诗人信息及作品。 2. 数据库存储:mysql是一种关系型数据库,通过flask_sqlalchemy存储数据,可以方便地进行数据的增删改查操作。 3. 前端设计:前端设计包括搜索页面的设计,需要支持用户输入过滤和搜索。搜索语法支持按诗人搜索和按诗句搜索。展示方式可以使用模态窗或者跳转页面。 4. 后端设计:后端处理业务逻辑,主要是搜索功能,根据前端传回的值查询数据库。后端还需要配合pyecharts展示柱状图,展示诗人的诗数量前十。 5. 数据表设计:本项目需要设计两张表:一张是诗人表,用于存储诗人的信息,包括姓名、年代、简介等字段;一张是诗词表,用于存储诗词的信息,包括诗词名称、诗词内容、解析等字段。 6. 搜索功能实现:搜索功能是本项目的核心,需要能够处理用户的各种输入,包括特定的搜索语法,并能返回正确的搜索结果。 7. 柱状图展示:通过pyecharts,可以将数据以柱状图的形式展示出来,本项目中,可以展示诗人的诗数量前十的柱状图。 8. 网站信息获取:通过爬虫获取网站信息,需要对网站的结构有足够的了解,以便能够准确获取需要的数据。