【Java Stream API去重与筛选实战】:distinct与filter的巧妙应用

发布时间: 2024-12-10 02:25:05 阅读量: 17 订阅数: 12
PDF

Java中对List去重 Stream去重的解决方法

![Java Stream API的高效数据处理](https://img-blog.csdnimg.cn/img_convert/c630c646ce9e32319c8b0fbafad8a370.jpeg) # 1. Java Stream API简介 ## 简介 Java Stream API是Java 8中引入的一个新特性,它提供了一种高效且易于理解的方式来处理集合(Collection)数据。Stream API利用函数式编程的优势,支持多种方式对集合进行操作,包括过滤、映射、排序、查找、聚合等。 ## 特点 Stream API的一个显著特点就是它的操作具有延迟执行(Lazy Evaluation)的特性。这意味着大部分的操作并不会立即执行,而是会延迟到真正需要结果的时候才进行处理。这种机制使得多个操作可以以链式的方式组合起来,最终一次性完成,极大提升了性能和可读性。 ## 基本用法 下面是一个简单的示例,演示了如何使用Stream API来处理一个List集合,并打印出集合中所有的偶数元素: ```java import java.util.Arrays; import java.util.List; import java.util.stream.Collectors; public class StreamExample { public static void main(String[] args) { List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6); List<Integer> evenNumbers = numbers.stream() // 创建流 .filter(n -> n % 2 == 0) // 筛选偶数 .collect(Collectors.toList()); // 收集结果 evenNumbers.forEach(System.out::println); // 打印结果 } } ``` 这段代码首先创建了一个包含数字的List,然后使用`.stream()`生成流,`.filter()`方法筛选出偶数,并最终收集到一个新的List中。`.forEach()`方法用于遍历并打印出筛选后的结果。这个例子简单展示了如何使用Stream API进行基本操作。 # 2. Stream API中的去重操作 ### 2.1 distinct方法的基本用法 #### 2.1.1 distinct的原理和行为 `distinct`方法是Java Stream API中用于去除流中重复元素的一个重要方法。它基于元素的自然顺序或自定义比较器来确保流中的元素唯一性。当使用`distinct`方法时,它会检查流中的元素是否相等,即调用元素的`equals`方法进行比较。在内部,它实际上是使用了`HashSet`来进行元素的唯一性检查。 - 对于基础类型的流,如`IntStream`、`DoubleStream`或`LongStream`,`distinct`直接利用它们的`equals`和`hashCode`方法。 - 对于对象类型的流,如`Stream<T>`,则需要对象类型的类正确实现了`equals`和`hashCode`方法,以便正确识别重复的对象。 这里需要注意,由于`distinct`方法内部使用了`HashSet`,因此它不会保留任何元素的原始顺序,而是以任意的顺序返回不重复的元素。 #### 2.1.2 去重操作的实践案例 假设有一个商品类`Product`,它包含了商品的ID、名称和价格。如果想要创建一个商品流,然后去除重复的商品,可以如下使用`distinct`方法: ```java class Product { private final int id; private final String name; private final double price; // 构造器、getter和equals以及hashCode方法省略 @Override public boolean equals(Object obj) { if (this == obj) return true; if (obj == null || getClass() != obj.getClass()) return false; Product product = (Product) obj; return id == product.id; } @Override public int hashCode() { return Objects.hash(id); } } // 示例代码 List<Product> uniqueProducts = products.stream() .distinct() .collect(Collectors.toList()); ``` ### 2.2 去重高级技巧 #### 2.2.1 结合自定义对象去重 在实际开发中,我们可能会遇到需要基于对象的多个属性进行去重的情况。比如,需要根据商品的ID和名称组合来确定商品的唯一性。这种情况下,需要实现自定义的`equals`和`hashCode`方法,或者在`distinct`中使用复合键比较。 以下是一个示例: ```java public class ProductKey { private final int id; private final String name; public ProductKey(int id, String name) { this.id = id; this.name = name; } // equals和hashCode方法省略 } // 示例代码 Stream<Product> stream = products.stream(); Stream<Product> distinctStream = stream.map(p -> new ProductKey(p.getId(), p.getName())) .distinct() .map(key -> products.stream().filter(p -> key.equals(new ProductKey(p.getId(), p.getName()))) .findFirst().get()); ``` #### 2.2.2 复合条件去重策略 当需要根据多个属性进行去重时,我们可以利用`Collectors.toMap`来创建一个映射表,其中键是由复合属性创建的键,值是元素本身。之后利用`Map`的特性进行去重。 ```java Map<ProductKey, Product> productMap = products.stream() .collect(Collectors.toMap(p -> new ProductKey(p.getId(), p.getName()), p -> p)); List<Product> uniqueProducts = new ArrayList<>(productMap.values()); ``` 这种方式会抛出`IllegalStateException`,如果存在重复的键,可以选择合并策略来解决,比如保留价格最高的商品。 ```java Map<ProductKey, Product> productMap = products.stream() .collect(Collectors.toMap(p -> new ProductKey(p.getId(), p.getName()), p -> p, (p1, p2) -> p1.getPrice() > p2.getPrice() ? p1 : p2)); List<Product> uniqueProducts = new ArrayList<>(productMap.values()); ``` 这种方式通过使用自定义的合并函数,选择性地保留了具有更高价格的商品。通过这种去重高级技巧,我们可以灵活地处理各种复杂的去重需求。 # 3. Stream API中的筛选操作 ##
corwn 最低0.47元/天 解锁专栏
买1年送1年
点击查看下一篇
profit 百万级 高质量VIP文章无限畅学
profit 千万级 优质资源任意下载
profit C知道 免费提问 ( 生成式Al产品 )

相关推荐

SW_孙维

开发技术专家
知名科技公司工程师,开发技术领域拥有丰富的工作经验和专业知识。曾负责设计和开发多个复杂的软件系统,涉及到大规模数据处理、分布式系统和高性能计算等方面。
专栏简介
本专栏深入探讨了 Java Stream API,一种用于高效数据处理的强大工具。它涵盖了从 Java 8 到 Java 11 的演变,提供实用指南以掌握新特性和性能优化技巧。专栏还深入研究了并发处理,提供了 parallel 和 sequential 流的性能对比和选择指南。此外,它还揭示了 10 个常见的错误,提供了解决方案以优化性能。专栏探讨了大数据环境下的 Stream API 应用,提供了高效数据清洗和处理技巧。它还比较了流式编程和集合操作,突出了 Stream API 的优势。此外,专栏还提供了自定义收集器、高级中间操作技巧、多数据源处理策略以及自定义排序技巧的实践指南。通过全面分析优缺点,专栏对比了 Stream API 和外部迭代,并提供了分组、分区、去重和筛选的深入剖析。最后,专栏提供了时间复杂度优化技巧,以减少中间操作的开销,从而提高性能。

专栏目录

最低0.47元/天 解锁专栏
买1年送1年
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
C知道 免费提问 ( 生成式Al产品 )

最新推荐

【Docker基础入门】:掌握Docker技术,开启云原生之旅

![【Docker基础入门】:掌握Docker技术,开启云原生之旅](https://blog.jetbrains.com/wp-content/uploads/2021/11/Docker_MinikubeConnect2.png) # 摘要 Docker作为一种流行的容器化技术,在软件开发和部署领域中扮演着重要角色。本文从Docker技术的基础知识讲起,逐步深入到安装、配置、镜像制作与管理、容器实践应用以及企业级应用与实践。通过系统性地介绍Docker环境的搭建、命令行操作、网络与存储配置、镜像的构建优化、镜像仓库的维护,以及容器化应用的部署和监控,本文旨在为读者提供全面的Docker使

【HFSS仿真新手速成】:5个步骤带你精通边界与端口设置

![【HFSS仿真新手速成】:5个步骤带你精通边界与端口设置](https://semiwiki.com/wp-content/uploads/2021/01/ansys-HFSS-electric-field-distribution-in-coax-to-waveguide-adapter-1024x576.png) # 摘要 本文全面介绍了HFSS仿真软件在电磁仿真领域的应用,特别关注于边界条件和端口设置的基础知识与进阶技巧。首先概述了HFSS仿真和基础设置的重要性,随后深入探讨了边界条件的理论基础、设置步骤、以及对仿真结果的影响。第三章详细解析了端口设置的理论与实践操作,并分析了其对

【Python电子表格自动化速成】:从入门到精通的一步到位指南

![【Python电子表格自动化速成】:从入门到精通的一步到位指南](https://img-blog.csdnimg.cn/4eac4f0588334db2bfd8d056df8c263a.png) # 摘要 随着信息技术的发展,Python在电子表格自动化领域的应用越来越广泛。本文首先概述了Python电子表格自动化的基本概念,随后详细介绍了Python基础、电子表格自动化工具的选择与配置、实战演练以及高级功能拓展。本文通过深入探讨数据处理、分析、可视化和报告生成等关键环节,展示了如何利用Python及其库(如Pandas、Matplotlib/Seaborn)高效地自动化处理电子表格任

【AmapAuto协议效率提升秘籍】:车辆调度新策略全解析

![【AmapAuto协议效率提升秘籍】:车辆调度新策略全解析](https://productdesignonline.com/wp-content/uploads/2023/04/bottom-up-assemblies-min-1024x576.png) # 摘要 本文综述了AmapAuto协议在车辆调度领域的应用和高效调度策略的实现。首先,概述了车辆调度问题的历史和发展的基础理论,包括不同调度算法的分类和优化目标。然后,详细分析了在AmapAuto协议指导下,如何设计实时高效调度策略的算法框架,并通过实践案例对策略的有效性进行验证。接下来,本文探讨了AmapAuto协议的实战应用,包

【大型项目代码质量守护者】:PowerArtist在大型项目中的应用案例

![【大型项目代码质量守护者】:PowerArtist在大型项目中的应用案例](https://ceshiren.com/uploads/default/original/2X/9/95cec882d02fba53d34cfd61120087ef5a052220.jpeg) # 摘要 本论文旨在全面介绍PowerArtist工具,从基础理论到实际应用,再到高级技巧和案例研究。首先概述了PowerArtist工具,并探讨了代码质量的重要性及其度量方法。接着,文章详细阐述了PowerArtist的核心功能,如静态代码分析、代码度量和缺陷检测技术,并介绍其集成和部署策略。第三章通过实践案例分析了工

【CDD数据库性能优化】:揭秘进阶技巧,提升数据库响应速度

![【CDD数据库性能优化】:揭秘进阶技巧,提升数据库响应速度](https://www.dnsstuff.com/wp-content/uploads/2020/01/tips-for-sql-query-optimization-1024x536.png) # 摘要 本文主要探讨了CDD数据库性能优化的各个方面,从理论基础到实践应用,再到高可用性策略和高级技巧。首先介绍了CDD数据库的架构理解和性能优化的基本概念,重点阐述了性能瓶颈的识别和性能监控的分析工具,以及优化的目标与策略。其次,通过索引优化技术、查询优化以及系统配置调整三方面深入介绍了性能调优实践。此外,还详细讨论了数据库高可用

【精通Matlab】:工业机器人轨迹规划与运动控制的实战指南

![基于Matlab的工业机器人运动学和雅克比运动分析.doc](https://img-blog.csdnimg.cn/20200409140355838.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzMyMTQ2MzY5,size_16,color_FFFFFF,t_70) # 摘要 本文综述了Matlab在工业机器人领域的应用,包括机器人运动学基础理论、轨迹规划、运动控制以及轨迹优化的高级应用。首先,介绍了机器人运动学

专栏目录

最低0.47元/天 解锁专栏
买1年送1年
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
C知道 免费提问 ( 生成式Al产品 )