String html = "<!DOCTYPE html>" + "<html>" + "<head>" + "<title>Hello world!</title>" + "</head>" + "<body>" + "<h1>Hello there!</h1>" + "<p>First paragraph</p>" + "<p class=\"not-first\">Second paragraph</p>" + "<p class=\"not-first third\">Third <a href=\"page.html\">paragraph</a></p>" + "</body>" + "</html>"; // 解析文件 Document doc = Jsoup.parse(html); // 获取文件标题 String title = doc.select("head > title").first().text(); System.out.println(title); // 你好,世界! Element firstParagraph = doc.select("p").first(); // 获取除第一段外的所有段落 Elements otherParagraphs = doc.select("p.not-first"); // 和...一样 otherParagraphs = doc.select("p"); otherParagraphs.remove(0); // 获取第三段(其他列表中的第二段) // 不包括第一段) Element thirdParagraph = otherParagraphs.get(1); // 选择: thirdParagraph = doc.select("p.third"); // 您也可以在元素中进行选择,例如具有href属性的锚点 // 在第三段中。 Element link = thirdParagraph.select("a[href]"); // or the first <h1> element in the document body Element headline = doc.select("body").first().select("h1").first();
您可以在此处找到支持的选择器的详细概述。