博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Jsoup(三)-- Jsoup使用选择器语法查找DOM元素
阅读量:6195 次
发布时间:2019-06-21

本文共 1994 字,大约阅读时间需要 6 分钟。

1.Jsoup可以使用类似于CSS或jQuery的语法来查找和操作元素.

2.实例如下:

public static void main(String[] args) throws Exception{        // 创建httpClient实例        CloseableHttpClient httpClient = HttpClients.createDefault();        // 创建httpGet实例        HttpGet httpGet = new HttpGet("http://www.cnblogs.com");        httpGet.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0");        CloseableHttpResponse response = httpClient.execute(httpGet);        String content = null;        if(response != null){            HttpEntity entity = response.getEntity();               content = EntityUtils.toString(entity, "UTF-8");  // 获取网页内容            Document document = Jsoup.parse(content);  // 解析网页,得到文档对象                        // 1.查找所有帖子DOM            Elements elements = document.select(".post_item .post_item_body h3 a");            for(Element ele : elements){                System.out.println("博客标题:" + ele.text());            }            System.out.println("------------------------分割线------------------------");                        // 2.查找带有href属性的a元素            Elements hrefElements = document.select("a[href]");            for(Element ele : hrefElements){                System.out.println(ele.toString());            }            System.out.println("------------------------分割线------------------------");                        // 3.查找扩展名为.png的图片DOM节点            Elements imgElements = document.select("img[src$=.png]");            for(Element ele : imgElements){                System.out.println(ele.toString());            }            System.out.println("------------------------分割线------------------------");                        // 4.获取tag为title的第一个DOM元素            Element titleEle = document.getElementsByTag("title").first();            System.out.println("标题为:" + titleEle.text());        }        if(response != null){            response.close();        }        if(httpClient != null){            httpClient.close();        }    }

3.Jsoup学习地址

  

 

你可能感兴趣的文章
Android
查看>>
上传文件
查看>>
软件开发的流程
查看>>
代码复审和两人合作
查看>>
Mysql错误问题记录
查看>>
PHP学习笔记(3)-Zend Studio安装和汉化
查看>>
Api程序接口对接
查看>>
科技的继续发展会带给我们什么?
查看>>
开源方案搭建可离线的精美矢量切片地图服务-5.Mapbox离线项目实现
查看>>
SQLite的时候判断语句是否纯在:出现RuntimeException
查看>>
C语言笔记
查看>>
ajax实例1
查看>>
js学习篇--数组按升序降序排列
查看>>
MyBatis笔记——Mapper动态代理
查看>>
ElasticSearch入门及核心概念介绍
查看>>
VC++2010开发数字图像系统1
查看>>
表达式求值
查看>>
使用PPRevealSideViewController创建抽屉式导航
查看>>
算法踩坑小记
查看>>
网关地址设置
查看>>