现用一台2G内存4核CPU的电脑，尽可能快速的找出3.7亿个字中第一个不重复的字符，Java代码利用多线程分治和hash实现

首先，我们需要将3.7亿个字分成多个小块，每个小块的大小为1MB左右，然后利用多线程处理每个小块。每个线程处理小块的过程如下： 1. 读入小块内容到内存中； 2. 遍历小块中的每一个字符，利用hash算法计算出该字符的hash值； 3. 将hash值作为key，该字符在小块中的位置作为value，存入一个HashMap中； 4. 遍历HashMap，找出第一个value为1的字符，并记录该字符在小块中的位置； 5. 将该位置加上小块在总数据中的偏移量，就得到了整个数据中第一个不重复的字符的位置。 Java代码如下： ```java import java.io.*; import java.util.*; public class FirstNonRepeatingChar { private static final int BLOCK_SIZE = 1024 * 1024; // 每个小块的大小 private static final int THREAD_NUM = 4; // 线程数 private static final int MOD = 1000000007; // hash取模的值 public static void main(String[] args) throws Exception { long start = System.currentTimeMillis(); // 读入数据 BufferedReader br = new BufferedReader(new FileReader("data.txt")); StringBuilder sb = new StringBuilder(); String line; while ((line = br.readLine()) != null) { sb.append(line); } br.close(); String data = sb.toString(); // 将数据分成多个小块 List<String> blocks = new ArrayList<>(); int len = data.length(); int blockNum = (len + BLOCK_SIZE - 1) / BLOCK_SIZE; for (int i = 0; i < blockNum; i++) { int startIdx = i * BLOCK_SIZE; int endIdx = Math.min((i + 1) * BLOCK_SIZE, len); blocks.add(data.substring(startIdx, endIdx)); } // 多线程处理每个小块 List<Thread> threads = new ArrayList<>(); List<Result> results = new ArrayList<>(); for (int i = 0; i < blockNum; i++) { String block = blocks.get(i); Result result = new Result(i * BLOCK_SIZE, -1); results.add(result); Thread thread = new Thread(new Runnable() { @Override public void run() { Map<Integer, Integer> map = new HashMap<>(); int len = block.length(); for (int j = 0; j < len; j++) { int c = block.charAt(j); int h = hash(c); if (map.containsKey(h)) { map.put(h, -1); } else { map.put(h, j); } } for (Map.Entry<Integer, Integer> entry : map.entrySet()) { if (entry.getValue() >= 0) { int pos = entry.getValue(); result.pos = result.offset + pos; break; } } } }); threads.add(thread); } for (Thread thread : threads) { thread.start(); } for (Thread thread : threads) { thread.join(); } // 找出所有不重复字符中最靠前的一个 int minPos = -1; for (Result result : results) { if (result.pos >= 0 && (minPos == -1 || result.pos < minPos)) { minPos = result.pos; } } System.out.println("第一个不重复的字符的位置：" + minPos); System.out.println("耗时：" + (System.currentTimeMillis() - start) + "ms"); } private static int hash(int c) { long h = 0; h = h * 31 + c; return (int) (h % MOD); } private static class Result { int offset; int pos; public Result(int offset, int pos) { this.offset = offset; this.pos = pos; } } } ``` 这里我们采用了hash算法，将每个字符映射成一个数字，然后将该数字作为key，该字符在小块中的位置作为value，存入HashMap中。如果遇到重复字符，将value设为-1。最后遍历HashMap，找出第一个value为1的字符，并记录该字符在小块中的位置。最后将该位置加上小块在总数据中的偏移量，就得到了整个数据中第一个不重复的字符的位置。

现用一台2G内存4核CPU的电脑，尽可能快速的找出3.7亿个字中第一个不重复的字符，Java代码利用多线程分治和hash实现

相关推荐

GalaxySIlI又曝光：防水＋2G内存＋Exynos四核CPU.pdf

2g.3g.4g对比分析.pptx

kubuntu-20.04.4-desktop-amd64 第一部分，共两部分，因为超过2G

现用一台2G内存4核CPU的电脑，尽可能快速的找出3.7亿个字中第一个不重复的字符，Java代码利用多线程分治实现

现有一台2G内存4核CPU的电脑，尽可能快速的找出一个3.7亿的字符中 第一个不重复的字符，用Java代码实现

用java设计一个算法，现有一台2G内存4核CPU的电脑，找出一个3.7亿字符中 第一个不重复的字符

永乐大典全书2877卷，11095册，约3.7亿个字；现用一台2G内存4核CPU的电脑尽可能快的找出书中第一个不重复的字符，Java代码实现

用一台2G内存4核CPU的电脑，从3.7亿长度的字符串中找出第一个不重复的字符，Java代码实现 注意 电脑内存为2G CPU为4核

用java设计一个算法，现有一台2G内存4核CPU的电脑，找出一个10G字符文件中 第一个不重复的字符

2G的内存 可以加载3.7亿长的字符文本文件吗

一个2G的应用程序，运行起来为什么只占20M的内存

awvs 2个cpu和2g运行内存，能同时扫描多少个

image_buffer = ctypes.create_string_buffer(1024) 开辟一个2G是怎么写

如何使用fdisk /dev/mmcblk0，成功分出一个2G大小的分区

写一个用Ehcache读取2G的CSV文件并缓存到临时文件中，最后以List的形式传出的demo

写一个用Ehcache读取2G的文件并缓存到临时文件中，最后以List<dto>的形式传出的demo

1. 在“服务器 5”中手动添加四块 SCSI 硬盘，前三块容量均为 2G，第四块容量为 4G，将前三块硬盘设置为一个主分区，第四块硬盘设置为两个逻辑分区（分别 2G 容量），并完成磁盘阵列 RAID10 的操作

安装mysql8.0.25 服务器128G内存 2颗CPU48核心，如何设置最优参数

我想用writefile将一份数据写入到多个新文件中，每个新文件最大为2g，该如何实现

最新推荐

###对华为OD分布式操作系统的详细介绍

2110220116吴骏博.py

zigbee-cluster-library-specification

管理建模和仿真的文件

【实战演练】MATLAB用遗传算法改进粒子群GA-PSO算法

openstack的20种接口有哪些

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

【实战演练】时间序列预测用于个体家庭功率预测_ARIMA, xgboost, RNN

怎么在集群安装安装hbase

现有一台2G内存4核CPU的电脑，尽可能快速的找出一个3.7亿的字符中第一个不重复的字符，用Java代码实现

用java设计一个算法，现有一台2G内存4核CPU的电脑，找出一个3.7亿字符中第一个不重复的字符

用一台2G内存4核CPU的电脑，从3.7亿长度的字符串中找出第一个不重复的字符，Java代码实现注意电脑内存为2G CPU为4核

用java设计一个算法，现有一台2G内存4核CPU的电脑，找出一个10G字符文件中第一个不重复的字符

2G的内存可以加载3.7亿长的字符文本文件吗