注意:默认情况下,输出中的并行级别取决于父 的分区数。您可以传递可选的
,; 参数来设置不同数量的任务。
,(9?9Bfunc(;numTasks=?
当调用在(J,K)对的数据集时,返回(J,K)对的数据集,其中使用给定的 !
函数 $ 聚合每个键的值,该函数必须是类型(K,K)-2K与 ">J 一样,! 任
务的数量可通过可选的第二个参数进行配置。
000(9?9BzeroValue?BseqOp(combOp(;numTasks=?
当调用在(J,K)对的数据集时,返回(J,6)对的数据集,其中使用给定的组合函
数和中性“AG值聚合每个键的值。允许与输入值类型不同的聚合值类型,同时避免不必要
的分配。和 ">J 一样,! 任务的数量可以通过可选的第二个参数来配置。
(9?9B;ascending=(;numTasks=?
当调用在 J 实现了 E!! 的(J,K)对数据集时,返回按键升序或降序排序的
(J,K)对的数据集,如 ascending 参数中所指定。
@-BotherDataset(;numTasks=?
当调用在类型(J,K)和(J,L)的数据集时,返回(J,(K,L))对的数据集以
及每个键的所有元素对。通过 XE,"E 和 $E 支持外连接。
0,BotherDataset(;numTasks=?
在类型(J,K)和(J,L)的数据集上调用时,返回BJ(B,1K2(,1L2??元
组的数据集。这个操作也被称为 "L。
-BotherDataset?:笛卡尔积
当调用类型 & 和 6 的数据集时,返回(&,6)对的数据集(所有元素对)。
-Bcommand([envVars]?
BnumParons?
减少 中的分区数量为 %%。用于过滤大型数据集后更高效地运行操作。
44BnumParons?
随机重新调整 中的数据以创建更多或更少的分区并在它们之间进行平衡。这总是
通过网络混洗所有数据。
44>-5-$44Bparoner?
根据给定的分区程序对 进行重新分区,并在每个生成的分区内按键对记录进行排
序。这比调用重新分区,然后在每个分区内进行排序更有效率,因为它可以将排序压入洗
牌机器。