淘宝 爬虫 java
时间: 2023-09-30 10:13:14 浏览: 52
您好!如果您想用Java编写一个爬取淘宝数据的爬虫,可以考虑使用Jsoup这个开源的HTML解析库。以下是一个简单的示例代码,可以帮助您开始:
```java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class TaobaoSpider {
public static void main(String[] args) {
String url = "https://www.taobao.com";
try {
// 发送HTTP请求获取页面内容
Document doc = Jsoup.connect(url).get();
// 使用CSS选择器提取需要的数据
Elements items = doc.select(".J_MouserOnverReq");
// 遍历提取到的数据
for (Element item : items) {
String itemName = item.select(".J_ClickStat").text();
String itemPrice = item.select(".price").text();
System.out.println("商品名称:" + itemName);
System.out.println("商品价格:" + itemPrice);
System.out.println("--------------------");
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
```
请注意,这只是一个简单的示例,具体的爬取逻辑和数据解析方式可能因网页结构的变化而有所调整。另外,请合理使用爬虫,并遵守网站的使用规则和法律法规。