Jeecms数据库设计:CMS采集表详解
需积分: 10 174 浏览量
更新于2024-07-17
收藏 1.33MB DOC 举报
"Jeecms是一个开源的内容管理系统,其数据库设计文档揭示了系统如何存储和管理数据。这个系统支持MySQL和Oracle等主流数据库。jc_acquisitionCMS采集表是Jeecms用于存储采集任务相关数据的一个核心表,包含了采集任务的各种配置和状态信息。"
在Jeecms的数据库设计中,jc_acquisitionCMS采集表是一个关键的部分,主要用于记录和管理系统的采集任务。该表的结构如下:
1. `acquisition_id`:这个字段作为主键,标识每个采集任务的唯一ID,类型为int(11)。
2. `site_id`:关联网站ID,类型为int(11),可能是作为外键引用其他表中的网站信息。
3. `channel_id`:表示采集任务所属的频道ID,同样为int(11),可能用于与频道配置表关联。
4. `type_id`:可能代表采集任务的类型,如新闻、图片等,也是int(11),可能是外键。
5. `user_id`:执行采集任务的用户ID,类型为int(11),用于追踪任务创建者。
6. `acq_name`:采集任务的名称,varchar(50)类型,用于方便用户识别不同的采集任务。
7. `start_time`:采集任务的开始时间,使用datetime类型记录。
8. `end_time`:采集任务的结束时间,同样为datetime类型。
9. `status`:当前采集任务的状态,int(11),有预定义的值如0(静止)、1(采集)、2(暂停)。
10. `curr_num`:当前采集的号码,int(11),用于追踪进度。
11. `curr_item`:当前采集的条目数,int(11)。
12. `total_item`:每页的总条目数,int(11),可能用于控制每次采集的数量。
13. `pause_time`:如果任务被暂停,记录暂停时的毫秒数,int(11),默认为0。
14. `page_encoding`:页面的编码,varchar(20),例如GBK,用于正确解析网页内容。
15. `plan_list`:采集列表,存储为longtext,可能包含复杂的采集规则或计划。
16. `dynamic_addr`:动态地址,varchar(255),可能用于指定动态内容的URL模板。
17. `dynamic_start`:页码开始位置,int(11),可能用于处理分页的起始标志。
18. `dynamic_end`:页码结束位置,int(11),对应分页结束的标志。
19. `linkset_start`:内容链接区开始标记,varchar(255),帮助系统识别链接的开始位置。
20. `linkset_end`:内容链接区结束标记,varchar(255),识别链接的结束位置。
21. `link_start`:内容链接开始标记,用于提取链接。
22. `link_end`:内容链接结束标记,与开始标记配合使用。
23. `title_start`:标题开始标记,用于提取文章标题。
24. `title_end`:标题结束标记,结束提取标题的位置。
25. `keywords_start`:关键字开始标记,可能用于提取文章的关键字。
26. `keywords_end`:关键字结束标记,结束关键字提取的位置。
通过这些字段,Jeecms能够灵活地配置和管理各种采集任务,包括任务的创建、执行、暂停和恢复,以及对采集内容的精确定位和解析。这使得Jeecms能够适应不同网站的结构,高效地获取和处理网络上的信息。
2022-06-16 上传
2022-06-02 上传
2022-06-03 上传
2010-04-14 上传
2012-05-15 上传
qq_23856411
- 粉丝: 0
- 资源: 5
最新资源
- 深入浅出:自定义 Grunt 任务的实践指南
- 网络物理突变工具的多点路径规划实现与分析
- multifeed: 实现多作者间的超核心共享与同步技术
- C++商品交易系统实习项目详细要求
- macOS系统Python模块whl包安装教程
- 掌握fullstackJS:构建React框架与快速开发应用
- React-Purify: 实现React组件纯净方法的工具介绍
- deck.js:构建现代HTML演示的JavaScript库
- nunn:现代C++17实现的机器学习库开源项目
- Python安装包 Acquisition-4.12-cp35-cp35m-win_amd64.whl.zip 使用说明
- Amaranthus-tuberculatus基因组分析脚本集
- Ubuntu 12.04下Realtek RTL8821AE驱动的向后移植指南
- 掌握Jest环境下的最新jsdom功能
- CAGI Toolkit:开源Asterisk PBX的AGI应用开发
- MyDropDemo: 体验QGraphicsView的拖放功能
- 远程FPGA平台上的Quartus II17.1 LCD色块闪烁现象解析