jsoup 获取css
时间: 2023-11-10 13:47:57 浏览: 48
使用 jsoup 获取 CSS 代码的方法如下:
1. 首先,需要使用 jsoup 的 `connect` 方法连接到需要获取 CSS 的网页。例如:
```
Document doc = Jsoup.connect("https://www.example.com").get();
```
2. 然后,可以使用 `doc.select` 方法来选择需要获取的 CSS 代码。例如:
```
Elements links = doc.select("link[rel=stylesheet]");
```
这个例子会选择所有 `rel` 属性为 `stylesheet` 的 `link` 标签。
3. 最后,可以使用 `links.attr("href")` 方法获取选中标签的 `href` 属性,即 CSS 文件的链接。例如:
```
String cssUrl = links.attr("href");
```
完整的代码示例如下:
```
Document doc = Jsoup.connect("https://www.example.com").get();
Elements links = doc.select("link[rel=stylesheet]");
String cssUrl = links.attr("href");
```
注意,获取到的 CSS 代码可能会被压缩或者经过其他处理,需要根据具体情况进行解析。
相关问题
jsoup爬取页面js css
jsoup是一个Java的HTML解析器,它可以很方便地解析HTML文档,获取HTML中的元素、属性、文本等信息。但是,jsoup并不支持解析JavaScript和CSS,因为JavaScript和CSS是在浏览器中解析的,而不是在HTML中解析的。
如果你想爬取页面的JavaScript和CSS,可以使用其他工具来获取页面源代码,如HttpClient、Selenium等。这些工具可以模拟浏览器的行为,获取完整的页面源代码,包括JavaScript和CSS。
下面是一个使用HttpClient和Jsoup来爬取页面的例子:
```java
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.IOException;
public class JsoupDemo {
public static void main(String[] args) throws IOException {
String url = "http://www.example.com";
CloseableHttpClient httpClient = HttpClients.createDefault();
HttpGet httpGet = new HttpGet(url);
String html = "";
try (CloseableHttpResponse response = httpClient.execute(httpGet);
InputStream inputStream = response.getEntity().getContent()) {
html = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
}
Document document = Jsoup.parse(html);
// 获取页面中的JavaScript和CSS
Elements scripts = document.select("script");
Elements styles = document.select("style");
// 处理页面元素
// ...
httpClient.close();
}
}
```
这个例子中,我们使用HttpClient来发送HTTP请求获取页面源代码,然后使用Jsoup来解析页面元素。通过`document.select("script")`和`document.select("style")`来获取页面中的JavaScript和CSS。
使用jsoup获取div标签中p标签的img标签
可以使用以下代码来获取div标签中p标签的img标签:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) {
String html = "<div><p><img src='img1.jpg'></p><p><img src='img2.jpg'></p></div>";
Document doc = Jsoup.parse(html);
Elements imgs = doc.select("div > p > img");
for (int i = 0; i < imgs.size(); i++) {
System.out.println(imgs.get(i).attr("src"));
}
}
}
```
这里使用了Jsoup库来解析HTML文档,然后使用CSS选择器 "div > p > img" 来获取div标签中p标签的img标签。最后遍历获取到的img标签,并输出它们的src属性值。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)