新建WordCount.java文
时间: 2024-10-04 18:01:23 浏览: 29
Hadoop下Eclipse用Java编程实现WordCount
新建一个名为`WordCount.java`的文件,通常是在Java编程环境中创建用于处理文本计数任务的一个简单示例。这个程序可能会是一个简单的命令行工具,它读取一个输入文件,然后计算并输出其中每个单词出现的次数。以下是一个基本的步骤和代码结构:
1. **打开集成开发环境(IDE)**:如Eclipse、IntelliJ IDEA或VS Code等,选择"New File"或"New Project"。
2. **命名文件**:右键点击项目结构中的"src"目录,然后选择"New" -> "Java Class",在弹出的窗口中输入类名"WordCount",确保它位于合适的包路径下(例如com.example.wordcount)。
3. **编写代码**:
- 首先,添加`import`语句,如`import java.io.File;` 和 `import java.util.Scanner;`,以便使用文件操作和输入流。
- 定义一个主函数`public static void main(String[] args)`作为程序入口点。
- 使用`Scanner`从命令行参数读取输入文件名。
- 创建一个HashMap存储单词及其出现次数。
- 逐行读取文件内容,将每一行分割成单词,并更新HashMap。
- 输出结果,比如遍历HashMap打印每个单词及其计数。
```java
import java.io.File;
import java.io.FileNotFoundException;
import java.util.HashMap;
import java.util.Map;
import java.util.Scanner;
public class WordCount {
public static void main(String[] args) {
if (args.length != 1) {
System.out.println("Usage: java WordCount <input_file>");
return;
}
String inputFile = args[0];
Map<String, Integer> wordCounts = new HashMap<>();
try (Scanner scanner = new Scanner(new File(inputFile))) {
while (scanner.hasNextLine()) {
String line = scanner.nextLine();
for (String word : line.split("\\s+")) { // 分割单词,忽略空格
word = word.toLowerCase(); // 可能需要转换为小写统一计数
wordCounts.put(word, wordCounts.getOrDefault(word, 0) + 1);
}
}
} catch (FileNotFoundException e) {
System.err.println("Error: Could not find file " + inputFile);
e.printStackTrace();
}
for (Map.Entry<String, Integer> entry : wordCounts.entrySet()) {
System.out.println(entry.getKey() + ": " + entry.getValue());
}
}
}
```
阅读全文