![](https://csdnimg.cn/release/download_crawler_static/88217908/bg5.jpg)
扫描模式;如果为 NOT 操作,则对其子表达式运算得来的扫描 模式进行取反
操作 P0SITIVE 变为 NEGATIVE,NEGATIVE 变为 POSITIVE,ROUGH 则保持不变;
步骤 224.所述过滤条件表达式为其他类型,则该数据页的扫描模式为 ROUGH。
所述步骤 230,包括下列步骤步骤 231.从不同列簇数据的第一个数据页开始遍
历;步骤 232.分别取得该数据页对应的页面概要信息和该数据页当前的扫描
模式; 通过比较两个数据页的起始记录号和结束记录号,判断这两个数据页
的相互关系,若是包 含关系,则执行步骤 233 ;若是等价关系,则执行步骤
234 ;若是其他情况,则执行步骤 235 ;步骤 233.如果两个数据页进行逻辑与
操作并且其中一个数据页的扫描模式为 NEGATIVE,则设置另一数据页的扫描
模式为 NEGATIVE ;如果两个数据页进行逻辑或操作并 且其中一个数据页的
扫描模式为 POSITIVE,则设置另一数据页的扫描模式为 POSITIVE ;步骤
234.如果两个数据页进行逻辑与操作并且任一数据页的扫描模式为 NEGATIVE,
则设置另一个数据页的扫描模式为 NEGATIVE ;如果两个数据页进行逻辑或操
作 并且任一数据页的扫描模式为 POSITIVE,则设置另一个数据页的扫描模式
为 POSITIVE ;步骤 235.其他情况,则不做任何操作;
步骤 236.根据计算需求移动相应列簇数据的下一个数据页,返回步骤 232,直
到 遍历完所述不同的列簇数据。为实现本发明的目的还提供一种基于 Hadoop
的海量流数据存储和查询系统,所 述系统,包括段级列簇式存储模块,用于
将流数据依次存储为列簇记录,并对列簇记录从前往 后进行压缩得到压缩数
据页,将该压缩数据页写到一个列簇数据,同时将该压缩数据页的 页面概要
信息追加写入到列簇数据的尾端,得到完整的数据段;过滤模块,在查询语句
执行的过程中,根据过滤条件,利用存储在数据段尾端的所 述页面概要信息
构建出一张扫描表对数据进行快速过滤。所述段级列簇式存储模块,包括列簇