Javascript正则表达式示例之HTML标签及HTML语法树
myzbx 2025-01-05 19:00 25 浏览
上一节聊到正则表达式的简单应用,不足之处欢迎留言交流。
今天,我们来看一下,如何使用正则表达式,匹配HTML标签及相关信息。
为什么要加上相关信息呢?
因为,如果您想写一个HTML语法树解析库的时候,可能会用到。
下面内容用到的语法
|:表示或者,要么前面,要么后面
(?<=我前面出现的内容)要匹配的内容:只匹配前面出现的字符之后的内容。
要匹配的内容(?=我前面出现的内容):只匹配后面出现的字符之前的内容。
分组捕获:一对完整的小括号(),表示一个组。
\数字:你要使用那一个分组捕获到的内容。
.*?:在正则表达式中,. 表示匹配任意字符,* 表示匹配 0 到任意次的前一个字符,? 表示非贪婪匹配,即尽可能匹配最少的字符。因此,.*? 表示匹配任意字符零次或多次,但尽可能匹配最少的字符。这个表达式通常用于匹配一个字符串中的所有内容,但是避免贪婪匹配导致的匹配错误。
^: 表示匹配开始
[要匹配的字符]:只匹配括号中的字符。
比如[0-9]、[a-z]、[A-Z]、[0-9a-zA-Z]、[0-9abc]等等。
[^要匹配的字符]:[]中加^表示匹配不是“要匹配的字符”。
1、匹配所有HTML标签,并清空。实现innerText类似的功能。
<body><div id="left">left</div><div id="right">right</div></body>
const text = document.body.innerText;
text = text.replace(/\n/g, '');
console.log(text);
//输出: leftright
假设没有innerText的功能呢?实现这个功能,使用正则表达式无疑是最方便的。
var text = document.body.innerHTML.replace(/<[^>]+>/g,'');
text = text.replace(/\n/g, '');
console.log(text);
//输出: leftright
是的,这个正则表达式的意思是,查找<>并且包含他们之间不为>的一段字符串。
到这里,您以为就结束了吗?您在网上搜索匹配HTML标签,可能也会得到这么一个结果(例如:<[^>]+>、<.*?>、等等),但实际上这只是开始,我们本着只要是程序就可能有bug的原则,所以我们来看下面一个例子。
const strHtml = '<span data-code=">">>是大于符号。</span>';
const strRes = strHtml.replace(/<[^>]+>/g, '');
console.log(strRes);
// ">>是大于符号。
[可怜]bug出现了,怎么办?别着急,请看下一个知识点。
2、匹配HTML标签属性,是写一个HTML语法树要经历的事情。
2.1、首先,我们先解决第一点最后的bug。
const strHtml = '<span data-code=">">>是大于符号。</span>';
// 一个小改动即可。
const strRes = strHtml.replace(/<("[^"]*"|[^>])+>/g, '');
console.log(strRes);
// >是大于符号。
完美[打脸] ,还没结束……
const strHtml = "<span data-code='>'>>是大于符号。</span>";
const strRes = strHtml.replace(/<("[^"]*"|[^>])+>/g, '');
console.log(strRes);
// '>>是大于符号。
甲:这不是我写的HTML不标准,是你的解析库兼容性不好,浏览器都可以识别,你为什么不可以?
已:……。
const strHtml = `<i code="<"><小于符号。</i><i code='>'>>大于符号。</i>`;
// 继续改造
const strRes = strHtml.replace(/<((["'])+.*?\2|[^>])+>/g, '');
console.log(strRes);
// <小于符号。>大于符号。
是的,利用正则表达式分组捕获的语法,实现了上面的需求。
2.2 现在,我们来看看,如何找到某个标签的所有属性。
const strHtml = `
<input type='text' disabled value="" class="txt txt-md" v-on:click="save('button')" />
`;
上面的例子中,有多种情况,我们首先来整理出来。
属性1:type='text'
/[\w]+=(["'])+.*?\1/
属性2:disabled
/[\w]+/
属性3:value=""
/[\w]+=(["'])+.*?\1/
属性4:class="txt txt-md"
/[\w]+=(["'])+.*?\1/
属性5:v-on:click="save('button')"
/[\w:]+=(["'])+.*?\1/
其他情况:欢迎讨论。
把所有情况连起来之后。
const strHtml = `<input type='text' disabled value="" class="txt txt-md" v-on:click="save('button')" />`;
const tagAttrs = strHtml.match(/(?<=\s)[\w:-]+(=(["']).*?\2)*/g) || [];
console.log(tagAttrs);
// ["type='text'", 'disabled', 'value=""', 'class="txt txt-md"', `v-on:click="save('button')"`]
人人为我,我为人人,欢迎您的浏览,我们一起加油吧。
相关推荐
- 首次被击毁!低调但先进的S-350,为何活得比韩国仿版差这么多?
-
【军武次位面】作者:乐乐2月18日,乌克兰军方网站发布了其前线炮兵侦察旅,在顿涅茨克地区攻击俄军S-350防空系统的现场视频。这也是这款地位独特的先进防空系统,第一次确认在战场上被摧毁——考虑到近三年...
- Windows 10 LTSC 2021 vs 2019:哪个更适合你?
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:闪电神龙微软近日发布了2024年11月份ISO镜像,包括Windows1124H2、Windows1022H2以及Server2025...
- 叛变投敌?俄军最先进隐身无人机S-70,在乌东上空被苏-57击落!
-
【军武次位面】作者:天狼2024年10月5日,乌克兰东部战区传来一条令人震惊的消息:一架俄罗斯最先进的隐身无人机S-70“猎人-B”在乌东上空被击落,令人意外的是,击落它的竟然是俄罗斯自己的战斗机。这...
- 自动驾驶车祸致1死1伤!特斯拉被判赔偿2.43亿美元
-
当地时间8月1日,美国佛罗里达州一个陪审团裁定,美国电动汽车制造商特斯拉应为2019年一辆配备自动驾驶系统的ModelS所致的致命车祸承担部分责任,并判令该公司向一名遇难女性的家属及一名伤者支付约2...
- HP488DZ 无绳电锤钻(18V)牧田DTD156SFJ
-
HP488DZ无绳电锤钻(18V)牧田DTD156SFJHP488DZ无绳电锤钻(18V)HP488DZ特征HP488D是一款基于HP457D开发的无绳电锤,采用18V锂离子电池供电。其...
- FJK-SJRFPZS防爆阀位行程开关级
-
解答常见误区在工业自动化和安全控制领域,FJK-SJRFPZS防爆阀位行程开关等级是一个关乎设备安全与运行效率的重要参数。许多用户在选择和应用这类开关时,可能对其等级分类存在一些误解。本文将通过通俗易...
- China's PLA aerobatic team to perform in Thailand for 50th anniversary of bilateral diplomatic ties
-
TIANJIN,March2(Xinhua)--TheBayiAerobaticTeamoftheChinesePeople'sLiberationArmy(PLA)A...
- JD.com Enters Travel and Hospitality With Supply Chain-Focused Strategy
-
TMTPOST--JD.comhasofficiallythrownitshatintoChina’sfiercelycompetitivetravelandhospita...
- JD.com Drives Robotics Funding Frenzy With Investments in LimX Dynamics, Spirit AI, and EngineAI
-
TMTPOST--JD.comisdoublingdownonembodiedintelligence,catalyzinganewwaveoffundinginChi...
- JD.com opens first JD Mall in Beijing, steps up offline retail push
-
bySongJiananJD.comhaslauncheditsfirstJDMALLinBeijing,expandingitsofflineretailfootpr...
- JD.com's food delivery fleet tops 120,000 full-time riders
-
JD.com'sfull-timefooddeliveryfleethassurpassed120,000ridersandisexpectedtoexceed150,00...
- China willing to share military equipment achievements with friendly countries: defense ministry
-
BEIJING,July8(Xinhua)--Chinahasalwaystakenaprudent,responsibleapproachtomilitaryexpor...
- FJK-SJRFPZS防爆阀位行程开关等级
-
解答常见误区在工业自动化和安全控制领域,FJK-SJRFPZS防爆阀位行程开关等级是一个关乎设备安全与运行效率的重要参数。许多用户在选择和应用这类开关时,可能对其等级分类存在一些误解。本文将通过通俗易...
- JD's 618 Festival Smashes Records as AI Powers Next-Gen Retail Engine
-
AsianFin–JD.com’s2025“618ShoppingFestival”wrappedupwithrecord-breakingmomentum,drivenby...
- JD’s Food Delivery Blitz Shakes Meituan as Founder Wang Xing Vows to Win at All Costs
-
Credit:CFPAsianFin--JD.comInc.isturninguptheheatinChina'sfooddeliverywars,andfounder...
- 一周热门
- 最近发表
-
- 首次被击毁!低调但先进的S-350,为何活得比韩国仿版差这么多?
- Windows 10 LTSC 2021 vs 2019:哪个更适合你?
- 叛变投敌?俄军最先进隐身无人机S-70,在乌东上空被苏-57击落!
- 自动驾驶车祸致1死1伤!特斯拉被判赔偿2.43亿美元
- HP488DZ 无绳电锤钻(18V)牧田DTD156SFJ
- FJK-SJRFPZS防爆阀位行程开关级
- China's PLA aerobatic team to perform in Thailand for 50th anniversary of bilateral diplomatic ties
- JD.com Enters Travel and Hospitality With Supply Chain-Focused Strategy
- JD.com Drives Robotics Funding Frenzy With Investments in LimX Dynamics, Spirit AI, and EngineAI
- JD.com opens first JD Mall in Beijing, steps up offline retail push
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)
- JS Loop For (32)