java 抓取服务器文件夹_java 怎么通过url获取远程服务器上某个文件夹下的所有文件名...
时间: 2023-10-03 08:08:25 浏览: 115
jsoup-1.13.1.jar Java爬虫经典框架 抓取网页内容
你可以使用 Java 的 URL 类和 IO 类来获取远程服务器上某个文件夹下的所有文件名。以下是一个示例代码:
```java
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
public class GetRemoteFiles {
public static List<String> getFiles(String urlPath) throws IOException {
List<String> fileList = new ArrayList<>();
URL url = new URL(urlPath);
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream()));
String line;
while ((line = reader.readLine()) != null) {
if (line.contains("href")) {
int startIndex = line.indexOf("href=\"") + 6;
int endIndex = line.indexOf("\"", startIndex);
String fileName = line.substring(startIndex, endIndex);
if (!fileName.equals("../")) {
fileList.add(fileName);
}
}
}
reader.close();
return fileList;
}
public static void main(String[] args) throws IOException {
String urlPath = "http://example.com/folder/";
List<String> fileList = getFiles(urlPath);
for (String fileName : fileList) {
System.out.println(fileName);
}
}
}
```
你需要将 `urlPath` 替换为你要获取文件名的文件夹 URL,然后运行代码即可。这个方法会从这个 URL 中读取 HTML 页面内容,并找到包含 `href` 的行,从中提取文件名。注意这个方法只能获取文件名,不能获取文件的内容。
阅读全文