百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

??jsoup Selector类学习笔记,快速提升你的HTML处理能力!

myzbx 2024-12-07 15:15 14 浏览

Selector 类是 jsoup 库中的一个核心类,用于通过 CSS 选择器语法来查找 HTML 文档中的元素。

选择器语法

通用选择器 * :匹配任何元素。

标签选择器 tag :匹配指定标签名的元素。

ID 选择器 #id :匹配具有指定 ID 的元素。

类选择器 .class :匹配具有指定类名的元素。

属性选择器 [attr] :匹配具有指定属性的元素。

属性值选择器 [attr=val] :匹配具有指定属性值的元素。

属性值前缀选择器 [attr^=valPrefix] :匹配属性值以指定前缀开头的元素。

属性值后缀选择器 [attr$=valSuffix] :匹配属性值以指定后缀结尾的元素。

属性值包含选择器 [attr*=valContaining] :匹配属性值包含指定文本的元素。

属性值正则选择器 [attr~=regex] :匹配属性值符合正则表达式的元素。

子元素选择器 E F :匹配作为 E 元素后代的 F 元素。

子元素选择器 E > F :匹配作为 E 元素直接子元素的 F 元素。

相邻兄弟选择器 E + F :匹配紧接在 E 元素后的 F 元素。

兄弟选择器 E ~ F :匹配在 E 元素之后的所有 F 元素。

分组选择器 E, F, G :匹配 E、F 或 G 元素。

伪类选择器

:lt(n) :匹配兄弟元素中索引小于 n 的元素。

:gt(n) :匹配兄弟元素中索引大于 n 的元素。

:eq(n) :匹配兄弟元素中索引等于 n 的元素。

:has(selector) :匹配包含指定选择器匹配的元素的元素。

:is(selector list) :匹配选择器列表中任意一个选择器的元素。

:not(selector) :匹配不匹配指定选择器的元素。

:contains(text) :匹配包含指定文本的元素。

:containsOwn(text) :匹配直接包含指定文本的元素。

:containsData(data) :匹配包含指定数据的元素。

:containsWholeText(text) :匹配包含指定完整文本的元素。

:containsWholeOwnText(text) :匹配直接包含指定完整文本的元素。

:matches(regex) :匹配包含符合正则表达式的文本的元素。

:matchesWholeText(regex) :匹配包含符合正则表达式的完整文本的元素。

:matchesWholeOwnText(regex) :匹配直接包含符合正则表达式的完整文本的元素。

结构伪类选择器

:root :匹配文档的根元素。

:nth-child(an+b) :匹配父元素之前有 an+b-1 个兄弟元素的元素。

:nth-last-child(an+b) :匹配父元素之后有 an+b-1 个兄弟元素的元素。

:nth-of-type(an+b) :匹配父元素之前有 an+b-1 个同类型兄弟元素的元素。

:nth-last-of-type(an+b) :匹配父元素之后有 an+b-1 个同类型兄弟元素的元素。

:first-child :匹配父元素的第一个子元素。

:last-child :匹配父元素的最后一个子元素。

:first-of-type :匹配父元素的第一个同类型子元素。

:last-of-type :匹配父元素的最后一个同类型子元素。

:only-child :匹配没有其他兄弟元素的元素。

:only-of-type :匹配没有其他同类型兄弟元素的元素。

:empty :匹配不包含任何子元素的元素。

方法

select(String query) :根据 CSS 选择器查找匹配的元素。

selectFirst(String cssQuery, Element root) :根据 CSS 选择器查找第一个匹配的元素。

注意事项

使用正则表达式时,可能需要使用 Pattern.quote("regex") 来正确解析。

特殊字符需要使用 \ 进行转义。

相关推荐

Web 界面开发指南,持续更新(web界面开发工具)

最近看到了一份非常精简但很实用的《Web界面开发指南》,其中仅有4页,却详细阐述了前端交互体验的关键要点。这份指南的思路和方法相当于一个最佳实践,比许多冗长的内容介绍更易于理解。实际上即使没有太...

矢量图标LOGO绘制教程(二):短信应用

前言本次教程使用软件为:InkscapeInkscape是一款功能强大的免费设计工具。无论您是插画家、设计师、网页设计师,还是只是需要创建一些矢量图像的人,Inkscape都适合您!它具有以下功能...

Deepseek生成图片的几个方法,示例模板附上

针对DeepSeek生成图片场景设计的原创提示语模板及示例,结合了多步引导、参数化要求和第三方工具协同策略,可适配不同设计需求:一、SVG代码生成法(适用技术型用户)提示语结构:请将下方文本内容转化为...

这个质量超高的PPT背景生成器,开发者居然才12岁,来自加拿大

很多人在上手PPT设计的时候,最头疼的可能就是背景的问题了,想找一些既能丰富视觉层次,又不影响文字呈现的背景图:但是又不知道,该去哪里找?或者找到了能不能商用:其实,你可以用一些免费的,背景生成器做出...

免费好用还高级!3个必须知道的设计网站,让你的PPT好看10倍

哈喽,大家早上好鸭~好久不见,我是三石,今天我又来进行PPT技巧分享啦~诶,这不前几天编辑部的萌萌就来找我约稿,说小叶子们对于神器网站的呼声很高,问我能不能写一篇文章汇总一下,我二话没说就答应了。常言...

前端必备!干货满满的前端周刊(第三期)

前端周刊是一份专为前端从业人员,以及对前端、设计领域感兴趣的朋友们打造的技术周刊。程小狮会精选出前端、设计领域近期相关的资讯、热点以及技术干货,与大家一同分享。前端周刊专注于前端领域技术分享。希望这份...

筛选了100个配色工具后,我挑出了这25个

研究主题:提升色彩感知的配色工具研究对象:配色工具UI设计中,颜色几乎是最先被感知到的设计元素,好的色彩感知是成为一个优秀的设计师的基础,配色工具层出不穷,辞典酱在筛选了100多种配色工具后,精选了...

前端开发-SVG从入门到实战(前端swc)

SVG(可缩放矢量图形)是前端开发中不可或缺的技术,它既能实现高清无损缩放,又能通过代码动态控制,完美适配复杂交互场景。本文将从基础到进阶,带你快速掌握SVG的核心技巧。SVG的核心优势矢量图形,无限...

一场演唱会,揭开了那英的“真面目”,怪不得被宋祖德喊话封杀

还在为运气发愁?别担心,关注我,好运连连,财运亨通!那英,大家都知道,这是个响当当的名字,作为华语乐坛的“天后”,她的歌声陪伴了无数人的青春,可最近这场在澳门的演唱会,可把她的热度压得有点低,甚至让人...

【消防宣传月】居家遇初火千万别着急!这就教你怎么灭→

“消防安全大家谈”“119”消防宣传月策划持续推新这次带来的是趣味互动科普第四弹!渝仔消妹精心设计了SVG互动式消防知识主题秀以屏幕互动的方式将知识点一步步鲜活地呈现给大家家庭初起火灾如何扑救家是温馨...

Winform革命:如何用aardio版AntdUI打造Web级美观界面?

大家好,我是风行者,一个拥有15年开发经验和教学经验的80后嘿,Winform开发者们!你是否还在为那些老掉牙的界面设计头疼?是不是每次看到那些光鲜亮丽的Web应用,心里就痒痒的,想着:“要是我的应用...

FastReport.Net v2016.6发布,添加打印对话框等新功能

新版本的FastReport添加了报表对象:PolyLineObject-中断曲线,PolygonObject-填充密闭多边形。除此之外,用户也能够通过移动、添加或者去除定位点来编辑已经准备好的对象...

高效办公,你值得拥有之原型工具AXURE篇

简介AxureRP是美国AxureSoftwareSolution公司旗舰产品,是一个专业的快速原型设计工具,让负责定义需求和规格、设计功能和界面的专家能够快速创建应用软件或Web网站的线框图...

300 多行代码搞定微信 8.0 的「炸」「裂」特效!

微信8.0更新的一大特色就是支持动画表情,如果发送的消息只有一个内置的表情图标,这个表情会有一段简单的动画,一些特殊的表情还有全屏特效,例如烟花表情有全屏放烟花的特效,炸弹表情有爆炸动画并且消息和...

基于Vue的yyds图片编辑器(vue editormd)

一、项目简介基于Vue的yyds图片编辑器二、实现功能支持复制粘贴支持自定义字体支持自定义素材支持自定义设计模板支持多元素垂直、水平对齐方式支持拆分/组合组合支持保存为SVG、PNG、JSON文件支持...