Jeecms数据库设计:CMS采集表详解

需积分: 10 2 下载量 174 浏览量 更新于2024-07-17 收藏 1.33MB DOC 举报
"Jeecms是一个开源的内容管理系统,其数据库设计文档揭示了系统如何存储和管理数据。这个系统支持MySQL和Oracle等主流数据库。jc_acquisitionCMS采集表是Jeecms用于存储采集任务相关数据的一个核心表,包含了采集任务的各种配置和状态信息。" 在Jeecms的数据库设计中,jc_acquisitionCMS采集表是一个关键的部分,主要用于记录和管理系统的采集任务。该表的结构如下: 1. `acquisition_id`:这个字段作为主键,标识每个采集任务的唯一ID,类型为int(11)。 2. `site_id`:关联网站ID,类型为int(11),可能是作为外键引用其他表中的网站信息。 3. `channel_id`:表示采集任务所属的频道ID,同样为int(11),可能用于与频道配置表关联。 4. `type_id`:可能代表采集任务的类型,如新闻、图片等,也是int(11),可能是外键。 5. `user_id`:执行采集任务的用户ID,类型为int(11),用于追踪任务创建者。 6. `acq_name`:采集任务的名称,varchar(50)类型,用于方便用户识别不同的采集任务。 7. `start_time`:采集任务的开始时间,使用datetime类型记录。 8. `end_time`:采集任务的结束时间,同样为datetime类型。 9. `status`:当前采集任务的状态,int(11),有预定义的值如0(静止)、1(采集)、2(暂停)。 10. `curr_num`:当前采集的号码,int(11),用于追踪进度。 11. `curr_item`:当前采集的条目数,int(11)。 12. `total_item`:每页的总条目数,int(11),可能用于控制每次采集的数量。 13. `pause_time`:如果任务被暂停,记录暂停时的毫秒数,int(11),默认为0。 14. `page_encoding`:页面的编码,varchar(20),例如GBK,用于正确解析网页内容。 15. `plan_list`:采集列表,存储为longtext,可能包含复杂的采集规则或计划。 16. `dynamic_addr`:动态地址,varchar(255),可能用于指定动态内容的URL模板。 17. `dynamic_start`:页码开始位置,int(11),可能用于处理分页的起始标志。 18. `dynamic_end`:页码结束位置,int(11),对应分页结束的标志。 19. `linkset_start`:内容链接区开始标记,varchar(255),帮助系统识别链接的开始位置。 20. `linkset_end`:内容链接区结束标记,varchar(255),识别链接的结束位置。 21. `link_start`:内容链接开始标记,用于提取链接。 22. `link_end`:内容链接结束标记,与开始标记配合使用。 23. `title_start`:标题开始标记,用于提取文章标题。 24. `title_end`:标题结束标记,结束提取标题的位置。 25. `keywords_start`:关键字开始标记,可能用于提取文章的关键字。 26. `keywords_end`:关键字结束标记,结束关键字提取的位置。 通过这些字段,Jeecms能够灵活地配置和管理各种采集任务,包括任务的创建、执行、暂停和恢复,以及对采集内容的精确定位和解析。这使得Jeecms能够适应不同网站的结构,高效地获取和处理网络上的信息。