java数据清洗csv
时间: 2023-09-03 11:12:17 浏览: 232
Java 中可以使用第三方库来进行 CSV 文件的数据清洗,例如 Apache Commons CSV。以下是一个示例代码,演示了如何使用 Apache Commons CSV 将数据从 CSV 文件中读取并进行清洗:
首先需要导入 Apache Commons CSV 的依赖:
```
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-csv</artifactId>
<version>1.8</version>
</dependency>
```
然后,可以编写如下代码来进行 CSV 文件的数据清洗:
```
import java.io.*;
import org.apache.commons.csv.*;
public class CsvDataCleaningExample {
public static void main(String[] args) throws Exception {
// 读取 CSV 文件
Reader in = new FileReader("input.csv");
Iterable<CSVRecord> records = CSVFormat.DEFAULT.withHeader().parse(in);
// 处理每一行数据
for (CSVRecord record : records) {
String name = record.get("Name");
String ageStr = record.get("Age");
int age = Integer.parseInt(ageStr);
// 进行数据清洗,例如去掉空格、转换大小写等
name = name.trim().toLowerCase();
// 输出清洗后的数据
System.out.println("Name: " + name + ", Age: " + age);
}
}
}
```
在上面的代码中,我们首先使用 Apache Commons CSV 的 `CSVFormat` 类来读取 CSV 文件,并使用 `withHeader()` 方法指定第一行为标题行,然后使用 `parse()` 方法将文件内容解析为一个 `Iterable`,其中每个元素代表一行数据。
接下来,我们使用 for 循环遍历每一行数据,并使用 `get()` 方法获取每个字段的值。在进行数据清洗时,我们可以使用多种方法,例如 `trim()` 方法去掉空格,`toLowerCase()` 方法将字符串转换为小写等。最后,我们输出清洗后的数据。
阅读全文