分批处理：将遍历的数据切分为几个批次，每次只操作一部分，避免一次性加载所有数据导致的连接压力。

时间: 2024-10-21 20:09:57 浏览: 28

JavaScript如何一次性展示几万条数据

5星 · 资源好评率100%

有一位同事跟大家说他在网上看到一道面试题：“如果后台传给前端几万条数据，前端怎么渲染到页面上？”，如何回答？于是办公室沸腾了，同事们讨论开了，你一言我一语说出自己的方案。有的说直接循环遍历生成html插到页面上；有的说应该用分页来处理；还有的说这个面试官是个白痴，哪有后台传几万条数据给前端这种情况的；我仔细思考了一下，先不论后端到底会不会白痴到传几万条数据给前端，假如真碰到这种情况，那么如果前端获取到数据以后，直接将数据转换成html字符串，通过DOM操作插入到页面，势必导致页面运行出现卡顿，为此我还特意写了一个 demo测试了一下，代码如下 $.get("data.json 在JavaScript中，一次性展示大量数据，比如几万条，是一个典型的性能挑战，因为直接操作DOM会导致页面卡顿，用户体验下降。对于这样的问题，通常需要采用一些优化策略来提高页面渲染速度。从描述中我们可以看到，直接遍历数据生成HTML字符串并一次性插入到页面会导致明显的性能问题。这是因为DOM操作是非常昂贵的，尤其是在处理大量元素时。在这个例子中，通过`$.get`获取JSON数据后，使用`loadAll`函数一次性生成13万个`<li>`元素，这导致了浏览器需要处理大量的DOM节点，从而造成页面卡顿。为了解决这个问题，可以采取分批次渲染数据的策略。这种策略的核心思想是将大数据集分成较小的块，每次只处理一小部分，而不是一次性全部处理。在JavaScript中，可以使用`setTimeout`来模拟多线程的效果，分批次地进行DOM操作。这样做的好处是可以避免一次性阻塞主线程，让浏览器有机会处理其他任务，提高用户体验。在提供的代码中，`loadAll`函数被改进为使用`setTimeout`分批加载数据。`group`函数将数据分割成每组500条，然后`loadPart`函数负责处理每一组数据。通过设置`setTimeout`的回调函数，确保每个批次的数据在一定时间间隔后被处理，这样可以确保页面不会因为大量DOM操作而变得卡顿。值得注意的是，为了保持`index`值的正确性，这里使用了闭包来捕获变量。此外，为了保证数据的加载顺序，可以使用一个全局变量`currIndex`来跟踪当前处理到哪一组数据，并在`loadPart`中根据`index`更新HTML内容。这样，即使数据是异步加载的，也可以按照原始顺序显示在页面上。总结来说，处理大量数据的前端优化策略主要包括： 1. 避免一次性生成大量DOM节点，而是分批次进行。 2. 使用`setTimeout`或`requestAnimationFrame`来分批处理任务，避免阻塞主线程。 3. 对数据进行分组，减少单次DOM操作的数量。 4. 使用闭包来保存状态，确保异步操作的正确性。通过这些技术，可以有效地处理和展示大规模数据，同时保证良好的页面性能和用户体验。在实际开发中，还可以考虑结合虚拟DOM、懒加载等更高级的优化手段，进一步提升性能。

分批处理是一种优化大数据集处理的技术，其核心思想是将大规模任务分解成较小、可管理的部分，逐一处理。在你提供的代码场景中，就是通过将`stock_basic`表中的股票代码列表分成多个小批次，每次只处理一批，比如每批处理100个股票代码。以下是分批处理的示例代码： ```python batch_size = 100 # 设置批次大小 current_batch = [] # 当前批次的股票代码列表 for index, row in df.iterrows(): if len(current_batch) < batch_size or index == df.shape[0]: # 到达批量结束或已处理完所有数据 # 提交当前批次的查询任务到线程池或异步任务队列 # 注意这里你需要使用异步函数或其他适合的并发工具 # 考虑到你之前使用的是线程池，我们可以继续使用类似的方式 if current_batch: submit_tasks_to_pool(current_batch) # 清空当前批次并将新的股票代码加入 current_batch = [row['ts_code']] else: current_batch.append(row['ts_code']) # 处理最后一个批次，如果还有剩余 if current_batch: submit_tasks_to_pool(current_batch) # 定义submit_tasks_to_pool函数用于提交任务到线程池 def submit_tasks_to_pool(batch): with concurrent.futures.ThreadPoolExecutor() as executor: for ts_code in batch: executor.submit(fetch_moneyflow, ts_code) ``` 在这个版本中，我们不再一次性读取全部股票代码，而是逐批读取并处理，降低了对数据库连接的需求，有助于解决“Too many connections”错误。

阅读全文

分批处理：将遍历的数据切分为几个批次，每次只操作一部分，避免一次性加载所有数据导致的连接压力。

相关推荐

微信小程序上滑加载下拉刷新（onscrollLower）分批加载数据（一）

PHP+MySQL实现对一段时间内每天数据统计优化操作实例

azurapi-data:将json数据处理为可用数据

数据分批加载

batching-fs-writestream:通过将数据分块写入磁盘来更快地写入文件，而不是像fs.createWriteStream中那样，每次写入一次syscall，只是缓冲数据块，而其他写入正等待将其分批分发给dis

influxdb-stream:分批将数据从InfluxDB中拉出并写入CSV文件

feathers-batch:将多个Feathers服务呼叫分批处理

分批取数 多线程数据处理

遍历目录下所有文件

Java编写在某一磁盘下遍历所有

java一次性查询处理几百万数据解决方法

用于将大量的数据进行分片分页分批处理的通用处理框架.zip

beast:将数据从Kafka加载到任何数据仓库

Android Studio ListView数据的分批加载

C#遍历文件

ListView块状滚动条加分批加载数据

纯前端模糊查询和数据的分批加载demo

多线程分批处理：ABAP中禁止的函数与任务管理

最新推荐

Java使用JDBC向MySQL数据库批次插入10W条数据(测试效率)

C#实现几十万级数据导出Excel及Excel各种操作实例

pytorch 实现将自己的图片数据处理成可以训练的图片类型

88秒插入1000万条数据到MySQL数据库表的操作方法

用Python将Excel数据导入到SQL Server的例子

SSM Java项目：StudentInfo 数据管理与可视化分析

管理建模和仿真的文件

负载均衡技术深入解析：确保高可用性的网络服务策略

怎么解决头文件重复包含

pyedgar：Python库简化EDGAR数据交互与文档下载

分批取数多线程数据处理