百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

domutils工具库的使用方法介绍

myzbx 2025-01-18 22:35 34 浏览

domutils 工具库详解 ?

domutils 是一个用于解析和操作 HTML/XML 文档的强大工具库。作为 Node.js 的内置模块,domutils 也可以作为独立的 npm 包使用。它提供了一系列方法,帮助开发人员在 Node.js 环境中高效地解析和操作 HTML/XML 文档。

安装 domutils

Node.js 环境中,domutils 通常无需单独安装,因为它是 Node.js 的内置模块。你可以直接在代码中引入它:

const domutils = require('domutils');

解释

  • require('domutils'):引入 domutils 模块,以便在后续代码中使用其提供的方法。

解析 HTML/XML 文档

使用 domutils,你可以将 HTML/XML 文档解析为 DOM 树,便于后续操作。通常需要结合 htmlparser2 模块来实现解析:

const htmlparser = require('htmlparser2');

const html = '<div><p>Hello, world!</p></div>';
const handler = new htmlparser.DomHandler();
const parser = new htmlparser.Parser(handler);
parser.write(html);
parser.end();

const dom = handler.dom;

解释

  1. require('htmlparser2'):引入 htmlparser2 模块,用于解析 HTML/XML 文档。
  2. const html = '<div><p>Hello, world!</p></div>';:定义要解析的 HTML 字符串。
  3. new htmlparser.DomHandler():创建一个 DOM 处理器,用于处理解析后的 DOM 树。
  4. new htmlparser.Parser(handler):创建一个 解析器,并绑定 DOM 处理器。
  5. parser.write(html) 和 parser.end():将 HTML 字符串写入解析器并结束解析过程。
  6. const dom = handler.dom;:获取解析后的 DOM 树。

查询 DOM 元素

domutils 提供多种方法用于查询 DOM 元素,例如按标签名、类名或 ID 查找元素:

const elementsByTag = domutils.getElementsByTagName(dom, 'p');
const elementsByClass = domutils.getElementsByClassName(dom, 'foo');
const elementById = domutils.findOne(dom, { id: 'bar' });

解释

  1. getElementsByTagName(dom, 'p'):查找所有标签名为 <p> 的元素。
  2. getElementsByClassName(dom, 'foo'):查找所有类名包含 foo 的元素。
  3. findOne(dom, { id: 'bar' }):查找第一个 ID 为 bar 的元素。

操作 DOM 元素 ????

通过 domutils,你可以对 DOM 元素进行增删改查操作,如添加、删除节点或修改内容:

const newElement = domutils.createElement('div', { class: 'new' }, 'New element');
domutils.append(elementById, newElement);

const textElement = domutils.createTextNode('This is a text node');
domutils.append(elementById, textElement);

解释

  1. createElement('div', { class: 'new' }, 'New element'):创建一个新的 <div> 元素,具有类名 new,并包含文本内容 New element。
  2. append(elementById, newElement):将新创建的元素追加到指定的 elementById 元素下。
  3. createTextNode('This is a text node'):创建一个文本节点,内容为 This is a text node。
  4. append(elementById, textElement):将文本节点追加到指定的 elementById 元素下。

进行 DOM 遍历

domutils 支持多种遍历方式,帮助开发者高效地遍历和处理 DOM 树:

domutils.traversal(dom, {
  callback: function (element) {
    // 处理当前遍历到的元素
    console.log(element.name);
  }
});

const children = domutils.children(elementById);

解释

  1. traversal(dom, { callback }):遍历整个 DOM 树,对每个元素执行回调函数。在示例中,打印每个元素的名称。
  2. children(elementById):获取指定元素的所有子节点,返回一个包含子节点的数组。

实用示例:修改 HTML 内容 ??

以下示例展示如何使用 domutils 修改 HTML 内容:

const htmlparser = require('htmlparser2');
const domutils = require('domutils');

const html = '<div id="container"><p class="text">Original Text</p></div>';
const handler = new htmlparser.DomHandler();
const parser = new htmlparser.Parser(handler);
parser.write(html);
parser.end();

const dom = handler.dom;

// 查找 p 标签
const pElement = domutils.findOne(dom, { tagName: 'p' });

// 修改文本内容
domutils.setText(pElement, 'Updated Text');

// 添加新的子元素
const newSpan = domutils.createElement('span', { class: 'highlight' }, ' - Highlighted');
domutils.append(pElement, newSpan);

// 输出修改后的 HTML
const modifiedHtml = domutils.getOuterHTML(dom[0]);
console.log(modifiedHtml);

解释

  1. 解析原始 HTML 字符串,生成 DOM 树。
  2. 使用 findOne 方法查找第一个 <p> 标签元素。
  3. 使用 setText 方法修改 <p> 标签的文本内容为 Updated Text。
  4. 创建一个新的 <span> 元素,类名为 highlight,并包含文本 - Highlighted。
  5. 将新的 <span> 元素追加到 <p> 标签内。
  6. 使用 getOuterHTML 方法获取修改后的 HTML 字符串,并输出。

运行结果

<div id="container"><p class="text">Updated Text<span class="highlight"> - Highlighted</span></p></div>

总结

domutils 作为一个功能丰富的 工具库,在 Node.js 环境中为开发者提供了强大的 HTML/XML 解析和操作能力。通过其灵活的查询和操作方法,开发者可以轻松地处理复杂的 DOM 树结构,实现高效的数据处理和页面操作。

无论是简单的内容修改,还是复杂的 DOM 遍历与操作,domutils 都能提供可靠的支持,极大地提升开发效率和代码质量。掌握 domutils 的使用,将为您的 Node.js 项目带来显著的便利和强大的功能扩展。

善用 domutils 工具库,轻松驾驭 HTML/XML 文档操作,提升开发效率!

相关推荐

IT之家学院:如何修改Win10 Edge浏览器下载路径?

IT之家讯目前Win10Edge浏览器的默认下载路径不可修改,只能是系统“下载”文件夹,虽然用户可以通过移动该文件夹位置来间接达到修改目的,但Edge浏览器本身却无法修改。不过我们可以通过修改注册表...

Win 10自带Edge浏览器史上最强,好内核配了滥界面

微软在Win10上为我们带来了全新的Edge浏览器,而跌落神坛的IE正式被微软抛弃!随着Win10周年版更新的到来,Edge浏览器也带来了很多全新的特性,功能也更加完善!这让微软信心大增,微软甚...

Win10全新浏览器Microsoft Edge图标:致敬IE

IT之家讯今天早些时候,微软宣布了斯巴达(Spartan)浏览器项目的官方命名,微软在Windows10上集成的新浏览器的内核名为Edge,所以大家一定猜到了,它被命名为MicrosoftEdge...

Edge 84稳定版发布:优化集锦 默认禁用TLS 1.0/1.1

时隔6周时间,Edge浏览器的最新稳定版v84.0.522.40正式发布。新版本为IE模式改善了站点列表下载时间,在“以管理员身份运行”运行时允许用户登录浏览器等等。下载地址:https...

真相:Win10微软Edge和IE11浏览器图标相似的原因

IT之家讯5月7日消息,微软在Build2015大会上公布了Win10斯巴达浏览器的正式名称“MicrosoftEdge”以及正式图标,蓝色的“e”。这款新浏览器的图标让各位Windows老用户...

微软 Win11,20 多年来首个没有 IE 浏览器的 Windows 版本

IT之家6月26日消息在Windows10的生命周期中,你可能已经安装了IE浏览器、微软Edge的经典版本,以及新的Chromium驱动的Edge浏览器。这三个浏览器完...

微软宣布2022年6月15日停止支持IE浏览器:已推出25年

5月20日消息,在推出25年之后,微软最终决定于明年停止对IE浏览器的支持。多年来,这款网络浏览器基本上没有太多消费者使用,为此微软定于2022年6月15日完全停止对其支持,转...

我采访了一位 Pornhub 工程师,聊了这些纯纯的话题

成人网站在推动Web发展方面所起到的作用无可辩驳。从突破浏览器的视频能力限制,到利用WebSocket推送广告(防止被广告拦截器拦截),你必须不断想出各种聪明的办法,让自己处在Web技术创...

如何在 Microsoft Edge 中使用IE浏览器

随着微软Windows10,Windows11的推出,IE浏览器逐渐被抛弃,可是国内一些银行和政府网站还必须使用IE才能访问,下面我来解决这个问题。首先在MicrosoftEdge中启用IE模式...

IE浏览器无法加载网站时将自动跳转到Edge中打开

来源:cnBeta.COM目前微软已经将开发重心放在基于Chromium的新版Edge浏览器上,而传统的InternetExplorer则逐渐被淘汰。也就是说,如果你当前使用的是IE...

告诉你手机信号栏中E、H、T都是什么意思!

手机信号经常会出现E啊,H啊,T啊……之类的字母,每次出现的时候小编都会自动关机,觉得手机坏掉了……ORZ……那么这些字母具体表示些什么意思呢?如果是G,那么代表的是GPRS,指2.5G网络,此时网速...

比Chrome更适合国人用 Chromium版Edge横空出世

编辑微软终于正式发布Chromium内核的Edge浏览器了。这意味着微软放弃了自研浏览器内核,Windows自带浏览器也成为了Chrome的马甲。关于微软为什么要这么做,笔者曾经撰文分析,大家可以点...

Microsoft 新浏览器 Edge 将不再支持 ActiveX、VBScript 技术

Microsoft继宣布将推出将取代IE的全新浏览器Edge后,日前又再宣布Edge不会支持沿用以久的ActiveX、VBScript与BrowerHelperObjects(...

隐藏功能超炫酷 新版Edge浏览器还能这么玩

基于Chromium的新版Edge浏览器已经开放测试,但由于是测试期,可供用户选择的功能还比较少。不过有一部分功能已经内置到浏览器中,只是尚未开放而已。这就像汽车里的刷EPU一样,没事自己玩一玩,也是...

微软推出的新版Edge浏览器,让我抛弃用了5年的谷歌

随着新版Edge浏览器的发布,这个微软的亲儿子以崭新的面貌和大家见面啦。这次更新可谓是好评如潮,相比浏览器届的老大哥——谷歌浏览器,它少了些臃肿,但又多了一些独特的功能。今天,我就为大家介绍8...