apache.tika判断文件类型
时间: 2023-10-16 16:11:00 浏览: 90
Apache Tika是一个用Java编写的开源工具,它可以自动检测和提取文件的元数据和文本内容,并确定文件的MIME类型。下面是一个使用Apache Tika检测文件类型的示例代码:
```java
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import org.apache.tika.detect.DefaultDetector;
import org.apache.tika.detect.Detector;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.mime.MediaType;
public class FileTypeDetector {
public static void main(String[] args) throws IOException {
// 创建文件对象
File file = new File("test.pdf");
// 创建元数据对象
Metadata metadata = new Metadata();
// 创建文件输入流
FileInputStream inputStream = new FileInputStream(file);
try {
// 创建文件类型检测器
Detector detector = new DefaultDetector();
// 检测文件类型
MediaType mediaType = detector.detect(inputStream, metadata);
// 输出文件类型
System.out.println(mediaType.toString());
} finally {
// 关闭文件输入流
inputStream.close();
}
}
}
```
在这个示例中,我们首先创建了一个文件对象,然后创建了一个元数据对象。然后我们创建了一个文件输入流,并使用Apache Tika的`DefaultDetector`来检测文件类型。最后,我们输出文件类型,这里我们以字符串形式输出,也可以使用`MediaType`对象来获取更多的信息。