大数据分页处理：内存、存储过程与物理索引策略

需积分: 9 77 浏览量更新于2024-09-13 收藏 370KB PDF 举报

在IT行业中，海量数据的分页处理是一个关键且常遇的问题，特别是在大数据管理和大型项目开发中。针对这个问题，论坛于2012年11月27日，在Java技术群中，一群具有3年以上经验的开发者讨论了多种应对策略。首先，参与者提出了两种主要的解决方案： 1. 内存分页：这是早期较为基础的方法，涉及到将所有数据一次性查询到内存中，然后在内存中进行分页操作。这种做法的优点是可以避免数据库查询，但缺点显而易见，即对内存资源的需求极高，可能需要严格限制单次查询的数据量，以防止内存溢出。这种方式在实际操作中可能会牺牲一定的性能，但考虑到内存处理的灵活性，对于内存资源充足的场景可能是可接受的。 2. 数据库存储过程分页：另一种方案是在数据库内部实现分页，通过编写存储过程来控制查询结果的数量。这种方式依赖于数据库的具体实现，不同数据库（如Oracle、SQL Server、MySQL等）可能有不同的语法和性能特性。然而，存储过程的优化至关重要，因为它们直接影响查询效率，尤其在处理海量数据时，性能优化是首要任务。其中，上海-java-?年成员提供了更具体的内存处理细节，强调了使用存储过程实现分页，比如通过参数传递来构造每一页的内容。这种方法注重用户体验，但同时需要考虑数据库的特性和索引优化，例如选择合适的索引类型（如组合索引、独立索引），以及调整索引的填充因子和聚集/非聚集属性。通用的SQL分页方法则涉及到了一种基于数据唯一标识（如主键）的逻辑分页技术。这种方法的核心步骤包括： - 获取符合条件的结果集中所有唯一标识的键值，并进行正向排序。 - 利用数据库特定的限制功能（如Oracle的ROWNUM，SQL Server的TOP，MySQL的LIMIT）来设定一个“最大结果集”，确保这个集合仅包含当前页面所需的记录数。 - 最后，对“最大结果集”进行逆序，以实现分页效果。海量数据的分页处理是一个需要综合考虑性能、内存使用、数据库特性和用户体验的问题。开发人员需要根据项目的实际情况，选择最适合的方案，并不断优化查询性能，以确保在满足业务需求的同时，保持系统的高效稳定。

【论题】+【方案】海量数据如何做分页处理

论题时间：

2012-11-27

论题参与：

java 技术群(3 年以上) 95379959,所以成员

论题内容：

在软件开发中，大数据量的查询是一个常见的问题，经常会遇到对大量数据进行查询的场

景，项目实际开发中应用场景都很常见，尤其是大公司针对数据管理很是严谨，专业的 DBA

对数据的认识完全是摆脱了程序的执行力度, 数据处理都是从专业角度 , 因此大部分程序

员都觉得思想违背了现实程序的处理，但是 DBA 毕竟不是大众化，思想角度至少很是专业。

常见的对大数据量查询的解决方案有很多种方案：一、将全部数据先查询到内存中，然后在

内存中进行分页，这种方式对内存占用较大，必须限制一次查询的数据量，因此牺牲较大说

法很实际。二、采用存储过程在数据库中进行分页，这种方式对数据库的依赖较大，不同的

数据库实现机制不通，并且查询效率不够理想，海量数据的诸多操作，优化当然是首当其冲

了。

方案一：

方案人：

上海-java-?年(554952494)

方案内容：

常规处理-

一、将全部数据先查询到内存中，然后在内存中进行分页，这种方式对内存占用较大，

必须限制一次查询的数据量，因此牺牲较大说法很实际。

内存处理方式，实施的详细细节大体

二、采用存储过程在数据库中进行分页，这种方式对数据库的依赖较大，不同的数据库

实现机制不通，并且查询效率不够理想，海量数据的诸多操作，优化当然是首当其冲了。

存储过程方式基于用户体验，实现分页构造，构造第一页显示，其他页数展示，基于参

数传递应用存储过程；

三、采用物理分页，基于数据的直接实现，物理分页根据所使用的数据库特性来组织，

根据数据环境和数据的特性建立索引，良好的索引建立是解决数据优化的好帮手，索引

当然是使得其当，不管是组合索引、独立索引，索引的填充因子和聚集、非聚集索引都

要考虑；

通用的 sql 分页方式,“限制行数结果集的倒序”分页：

1、取得符合条件的所有结果集中可以唯一标识的 Key 值(通常是主键),并正向排序。

2、利用数据库提供的特殊方法进行“最大结果集”的限制（在 Oracle 中使用 rownum,

sql server 中使用 top, mysql 中使用 limit...),

该“最大结果集”指包含当前所处页的所有记录数，“最大结果集”应该只包含惟一的 Key

值。

3、 “最大结果集”进行逆序，并取得“显示当前页显示数量的结果集”，该结果集中只

包含惟一的 Key 值。

4、所取得的 Key 值取得显示数据，该显示数据就是当前页应该显示的数据。

下载后可阅读完整内容，剩余6页未读，立即下载

changpao5000

粉丝: 0
资源: 5

大数据分页处理：内存、存储过程与物理索引策略

海量数据处理面试题

海量数据分页解决方案_demo

海量数据分页sql server经典

PHP数据库分页技术：高效处理海量数据，提升数据管理效率

PHP数据库操作类分页和排序技巧：高效处理海量数据

MyBatis-Plus分页查询与大数据：大数据场景下分页查询的解决方案，应对海量数据挑战

PHP数据库分页查询秘籍：高效处理海量数据，提升用户体验

PHP数据库搜索分页优化：高效处理海量数据，提升用户体验

mysql 海量数据分页

element 分页page-sizes无效

最新资源