悟了,html2canvas截图原理,看看它是如何截图的?
myzbx 2024-12-19 15:03 12 浏览
问题复现
之前在做 html 内容导出为 pdf、图片时,先是用 html2canvas 生成截屏,再进一步转换为 pdf 文件,感兴趣的同学可以看下这篇一文搞定前端 html 内容转图片、pdf 和 word 等文件,截图得到的图片内容、质量都没有什么问题。
不过最近有个同事反应,他导出的图片有 bug,这我倒挺好奇的,因为这个导出功能已经用了很久,并没有人反馈过有问题(除了那个 pdf 翻页内容被截断的问题,求助 jym :前端有好的解决方法吗?),于是我要了他的文档,果不其然,出现了下面红框所示的问题。
检查一下它的 DOM 结构,发现是下面这样,猜测是就是这个原因导致的。
为了验证自己的猜想,浅浅调试一下 html2canvas 的源码,看下 html2canvas 是怎样一个流程,它是如何将 html内转成 canvas 的。
调试开始
在 html2canvas 执行的地方打个断点,开始调试代码:
进入 html2canvas 内部,可以看到内部执行的是 renderElement 方法:
咱们直接进入到 renderElement 方法内部,看下它的执行流程:
renderElement 执行流程
判断传入节点是否有效
- Node.ownerDocument:只读属性,返回当前节点的顶层的 document 对象;
- document.defaultView:属性返回当前 document 对象所关联的 window 对象,如果没有,会返回 null。
这里主要判断节点,快速跳过,继续执行 。
合并配置项
将用户传入的 options 与默认的 options 合并
构建配置项,将传入的 opts 与默认配置合并,同时初始化一个 context 上下文对象(缓存、日志等):
缓存对象 cache
其中 cache 为缓存对象,主要是避免资源重复加载的问题。
原理如下:
如果遇到图片链接为 blob,在加载完成后,会添加到缓存 _cache 中:
下次使用直接通过 this._cache[src] 从缓存中获取,不用再发送请求:
同时,cache 中控制图片的加载和处理,包括使用 proxy 代理和使用 cors 跨域资源共享这两种情况资源的处理。
继续往下执行
克隆原始 DOM
使用 DocumentCloner 方法克隆原始 DOM,避免修改原始 DOM。
使用 clonedReferenceElement 将原始 DOM 进行克隆,并调用 toIFrame 将克隆到的 DOM 绘制到 iframe 中进行渲染,此时在 DOM 树中会出现 class 为 html2canvas-container 的 iframe 节点,通过 window.getComputedStyle 就可以拿到要克隆的目标节点上所有的样式了。
绘制 canvas
前面几步很简单,主要是对传入的 DOM 元素进行解析,获取目标节点的样式和内容。重点是 toCanvas 即将 DOM 渲染为 canvas 的过程,html2canvas 提供了两种绘制 canvas 的方式:
- 使用 foreignObject 方式绘制 canvas
- 使用纯 canvas 方法绘制
咱们接着执行,当代码执行到这里时判断是否使用 foreignObject 的方式生成 canvas:
使用 foreignObject方式绘制 canvas
首先了解下 foreignObject 是什么?
- svg 中的xmlns 全称是“XML Namespaces”,即 XML 命名空间,正是它的存在,在浏览器中 svg 才能正常渲染(下面这段代码是在 iconfont 上随便复制的一个 icon svg 代码);
- xml复制代码 <svg t="1692613183565" class="icon" viewBox="0 0 1024 1024" version="1.1" xmlns="http://www.w3.org/2000/svg" p-id="20058" width="200" height="200">
<path d="M548.571429 292.571429v182.784L731.428571 475.428571v73.142858l-182.857142-0.073143V731.428571h-73.142858V548.498286L292.571429 548.571429v-73.142858l182.857142-0.073142V292.571429h73.142858z" fill="#626B7D" p-id="20059"></path>
</svg> - foreignObject 允许包含来自不同的 XML 命名空间的元素,借助 <foreignObject> 标签,我们可以直接将 DOM 节点作为 foreignObject 插入 SVG 节点中进行渲染,如下:
- xml复制代码<svg xmlns="http://www.w3.org/2000/svg">
<foreignObject width="120" height="50">
<body xmlns="http://www.w3.org/1999/xhtml">
<div>测试测试</div>
</body>
</foreignObject>
</svg> - 可以看到 <foreignObject> 标签里面有一个设置了 xmlns="http://www.w3.org/1999/xhtml" 命名空间的 <body> 标签,此时 <body> 标签及其子标签都会按照 XHTML 标准渲染,实现了 SVG 和 XHTML 的混合使用。
- 这样只需要指定对应的命名空间,就可以把它嵌套到 foreignObject 中,然后结合 SVG,直接渲染。
- 对于不同的命名空间,浏览器解析的方式也不一样,所以在 SVG 中嵌套 HTML,解析 SVG 的时候遇到 http://www.w3.org/2000/svg 转化 SVG 的解析方式,当遇到了 http://www.w3.org/1999/xhtml 就使用 HTML 的解析方式。
- 这是为什么 SVG 中可以嵌套 HTML,并且浏览器能够正常渲染。
- foreignObject 已经支持除 IE 外的主流浏览器
弄懂 foreignObject 后,我们尝试将 foreignObjectRendering 设置为 true,看看它是如何生成 canvas 的:
js复制代码Html2canvas(warp, {
useCORS: true,
foreignObjectRendering: true,
})
在此处打个断点:
进入 ForeignObjectRenderer 类中
这里通过 ForeignObjectRenderer 实例化一个 renderer 渲染器实例,在 ForeignObjectRenderer 构造方法中初始化 this.canvas 对象及其上下文 this.ctx
调用 render 生成 canvas,进入到 render 方法:
render 方法执行很简单,首先通过 createForeignObjectSVG 将 DOM 内容包装到<foreignObject>中生成 svg:
生成的 svg 如下所示:
接着通过。loadSerializedSVG 将上面的 SVG 序列化成 img 的 src(SVG 直接内联),调用this.ctx.drawImage(img, ...); 将图片绘制到 this.canvas 上,返回生成好的 canvas 即可。
接着点击下一步,直到回到最开始的断点处,将生成好的 canvas 挂在到 DOM 上,如下:
js
复制代码document.body.appendChild(canvas)
这就解决了???收工!!!
NoNoNo,为什么使用纯 canvas 绘制就有问题呢? 作为 bug 终结者,问题必须找出来,干就完了 。
而且使用 foreignObject 渲染还有其他问题,我们后面再说。
foreignObject 绘制 canvas 的流程
- 首先克隆原始 DOM,并将所有样式都转为行内样式,避免修改到页面;
- 构建 ForeignObjectRenderer 渲染器实例,调用 renderer 方法;
- 将 DOM 内容通过 createForeignObjectSVG 转为 svg 元素;
- 通过 loadSerializedSVG 将上面的 svg 序列化成 img 的 src;
- 通过 drawImage 绘制图片到 canvas 上。
使用纯 canvas 绘制
要想使用纯 canvas 方式绘制,那么就需要将 DOM 树转换为 canvas 可以识别的数据类型,html2canvas 使用 parseTree 方法来实现转换,我们来看下它的执行过程。
直接在调用 parseTree 方法处打断点,进入到 parseTree 方法内:
parseTree 的作用是将克隆 DOM 转换为 ElementContainer 树。
首先将根节点转换为 ElementContainer 对象,接着再调用 parseNodeTree 遍历根节点下的每一个节点,转换为 ElementContainer 对象。
ElementContainer 对象主要包含 DOM 元素的信息:
ts复制代码type TextContainer = {
// 文本内容
text: string;
// 位置和大小信息
textBounds: TextBounds[];
}
export class ElementContainer {
// 样式数据
readonly styles: CSSParsedDeclaration;
// 当前节点下的文本节点
readonly textNodes: TextContainer[] = [];
// 除文本节点外的子元素
readonly elements: ElementContainer[] = [];
// 位置大小信息(宽/高、横/纵坐标)
bounds: Bounds;
// 标志位,用来决定如何渲染的标志
flags = 0;
...
}
ElementContainer 对象是一颗树状结构,层层递归,每个节点都包含以上字段,形成一颗 ElementContainer 树,如下:
继续下一步
通过 CanvasRenderer 创建一个渲染器 renderer,创建 this.canvas和this.ctx上下文对象与 ForeignObjectRenderer 类似
得到渲染器后,调用 render 方法将 parseTree 生成的 ElementContainer 树渲染成 canvas,在这里就与 ForeignObjectRenderer 的 render 方法产生差别了。
层叠上下文
概念不懂就看 MDN:层叠上下文
首先我们都知道 CSS 是流式布局,也就是在没有浮动(float)和定位(position)的影响下,是不会发生重叠的,从上到下、由外到内按照 DOM 树去布局。
而浮动和定位的元素会脱离文档流,形成一个层叠上下文,所以如果想正常渲染,就需要得到它们的层叠信息。
可以想象一下:在我们的视线与网页之间有一条看不见的 z 轴,层叠上下文就是一块块薄层,而这些薄层中有很多 DOM 元素,这些薄层根据层叠信息在这个 z 轴上排列,最终形成了我们看到的绚丽多彩的页面。
画个图好像更形象些:
白色为正常元素,黄色为 float 元素,蓝色为 position 元素
更多详细资料请阅读:深入理解 CSS 中的层叠上下文和层叠顺序
canvas 在绘制节点时需要先计算出整个目标节点里子节点渲染时所展现的不同层级,因为 Canvas 绘图需要根据样式计算哪些元素应该绘制在上层,哪些在下层。元素在浏览器中渲染时,根据 W3C 的标准,所有的节点层级布局,需要遵循层叠上下文和层叠顺序的标准。
调用 parseStackingContexts 方法将 parseTree 生成的 ElementContainer 树转为层叠上下文。
ElementContainer 树中的每一个 ElementContainer 节点都会产生一个 ElementPaint 对象,最终生成层叠上下文的 StackingContext 如下:
数据结构如下:
ts复制代码// ElementPaint 数据结构如下
ElementPaint: {
// 当前元素的container
container: ElementContainer
// 当前元素的border信息
curves: BoundCurves
}
// StackingContext 数据结构如下
{
element: ElementPaint;
// z-index为负的元素行测会给你的层叠上下文
negativeZIndex: StackingContext[];
// z-index为零或auto、transform或者opacity元素形成的层叠上下文
zeroOrAutoZIndexOrTransformedOrOpacity: StackingContext[];
// 定位或z-index大于等于1的元素形成的层叠上下文
positiveZIndex: StackingContext[];
// 非定位的浮动元素形成的层叠上下文
nonPositionedFloats: StackingContext[];
// 内联的非定位元素形成的层叠上下文
nonPositionedInlineLevel: StackingContext[];
// 内联元素
inlineLevel: ElementPaint[];
// 非内联元素
nonInlineLevel: ElementPaint[];
}
渲染层叠内容时会根据 StackingContext 来决定渲染的顺序。
继续下一步,调用 renderStack 方法,renderStack 执行 renderStackContent 方法,咱们直接进入 renderStackContent 内:
canvas 绘制时遵循 w3c 规定的渲染规则 painting-order,renderStackContent 方法就是对此规则的一个代码实现,步骤如下:
此处的步骤 1-7 对应上图代码中的 1-7:
- 渲染当前层叠上下文的元素的背景和边框;
- 渲染具有负 z-index 级别的子层叠上下文(最负的第一个);
- 对于流式布局、非定位的子元素调用 renderNodeContent 和 renderNode 进行渲染:
- 渲染所有未定位的浮动子元素,对于其中每一个,将该元素视为创建了一个新的堆栈上下文;
- 渲染正常流式布局、内联元素、非定位的子元素;
- 渲染 z-index 为 0 或 auto,或者 transform、opacity 等属性的子元素;
- 渲染由 z-index 大于或等于 1 的子元素形成的层叠上下文,按 z-index 顺序(最小的在前)。
可以看到遍历时会对形成层叠上下文的子元素递归调用 renderStack,最终达到对整个层叠上下文树进行递归的目的:
而对于未形成层叠上下文的子元素,就直接调用 renderNode 或 renderNodeContent 这两个方法,两者对比,renderNode 多了一层渲染节点的背景色和边框的方法(renderNode 函数内部调用 renderNodeBackgroundAndBorders 和 renderNodeContent 方法)。
renderNodeContent 用于渲染一个元素节点里面的内容,分为八种类型:纯文本、图片、canvas、svg、iframe、checkbox 和 radio、input、li 和 ol。
除了 iframe 的绘制比较特殊:重新生成渲染器实例,调用 render 方法重新绘制,其他的绘制都是调用 canvas 的一些 API 来实现,比如绘制文字主要用 fillText 方法、绘制图片、canvas、svg 都是调用 drawImage 方法进行绘制。
所有可能用到的 API
最终绘制到 this.canvas 上返回,至此,html2canvas 的调试就结束了。
纯 canvas 绘制流程
- 首先克隆原始 DOM,避免修改到页面;
- 使用 parseTree 递归遍历 html,生成 ElementContainer 树(与原始 DOM 层级结构类似);
- 构建 CanvasRenderer 渲染器实例,调用 renderer 方法;
- 遍历上一步生成的 ElementContainer,根据层叠规则生成层叠上下文StackingContext(与原始 DOM 层级结构区别较大);
- 遍历层叠上下文,递归地对层叠上下文各层中的节点和子层叠上下文进行解析并按顺序绘制在 Canvas 上,针对要绘制的每个节点,主要有以下两个过程:
- 创建画布,根据上一步生成的层叠对象递归渲染,最终将 html 内容绘制到画布 canvas 上。
针对最初的 Bug 分析
ok,当调试了一遍 html2canvas 的流程之后,再回到我们的问题上,很显然就是 canvas 渲染的时候的问题,也就是 renderNodeContent 方法,那我们直接在这里打个断点进行调试(为了方便我只输入一行文字进行调试),只有当是文本节点时会进入到此断点,等到 mark 标签中对应的元素进入断点时,查看:
可以看到此时 width 和 height 已经是父节点的宽高,果真如此 。
解决方案
既然已经知道了问题所在,那么我们开始解决问题,有以下两种解决方案可供参考:
foreignObjectRendering
在 html2canvas 配置中设置 foreignObjectRendering 为 true,此问题就可以解决吗?
然而现实并没有这么简单,这样又会引出新的问题:导出的图片内容丢失
这是为什么呢?
通过 W3C 对SVG 的介绍可知:SVG 不允许连接外部的资源,比如 HTML 中图片链接、CSS link 方式的资源链接等,在 SVG 中都会有限制。
解决方法:需要将图片资源转为 base64,然后再去生成截图,foreighnObject 这种方法更适合截取内容为文字内容居多的场景。
对包含背景色的内联标签截断处理
在对内联元素进行截断前,如何确定 p 标签中的 mark 标签有没有换行? 因为我们没必要对所有内联标签做处理。
如果 mark 标签的高度超过 p 标签的一半时,就说明已经换行了,然后将 <mark>要求一</mark> 替换为 <mark>要</mark><mark>求</mark><mark>一</mark> 即可,代码如下:
ts复制代码const handleMarkTag = (ele: HTMLElement) => {
const markElements = ele.querySelectorAll('mark')
for (let sel of markElements) {
const { height } = sel.getBoundingClientRect()
let parentElement = sel.parentElement
while (parentElement?.tagName !== 'P') {
parentElement = parentElement?.parentElement!
}
const { height: parentHeight } = (
parentElement as unknown as HTMLElement
).getBoundingClientRect()
// mark的高度没有超过p标签的一半时 则没有换行
if (height < parentHeight / 2) continue
// 超过一半时说明换行了
const innerText = sel.innerText
const outHtml = sel.outerHTML
let newHtml = ''
innerText.split('')?.forEach((text) => {
newHtml += outHtml.replace(innerText, text)
})
sel.outerHTML = newHtml
}
}
ok,再次尝试一下,完美解决,这下可以收工了。
总结
通过对一个不是 bug 的 bug 的分析,尝试调试了一遍 html2canvas 的代码,弄懂了浏览器截图的原理及 html2canvas 的核心流程,并从中学到了几点新知识:
- svg xmnls 作用以及渲染 HTML 内容的 foreignObject 标签;
- 使用 foreignObject 实现快速截图的方法;
- CSS 层叠上下文的概念;
- canvas 绘图的一些方法。。。
发现 canvas 真是一个有趣的东西,什么都能画,像我现在用于画图的工具excalidraw、图表库g6、g2、echarts都是用的 canvas 搞的,看来得抽时间学习一下 canvas,不要等到“书到用时方恨少“。
以上就是本文的全部内容,希望这篇文章对你有所帮助,欢迎点赞和收藏 ,如果发现有什么错误或者更好的解决方案及建议,欢迎随时联系。
作者:翔子丶 链接:https://juejin.cn/post/7277045020423798840 来源:稀土掘金 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
相关推荐
- 一键生成高颜值图表!让你的文字瞬间有画面感,职场人必备!
-
哈喽,打工人们!忙碌的周中,大熊又来给你们带来一个超实用的效率神器啦!这次的宝藏网站绝对是那种用过就离不开的"真香"型产品!假设你明天就要做重要汇报,可面对一大堆密密麻麻的文字材料,你...
- 批量将 Word 转换为 PDF/Excel/Txt/图片等多种格式
-
Word文档是我们工作中经常会打交道的一种文档格式,我们也经常会有需要对Word文档进行格式转换的需求,比如将Word格式转换为PDF、将Word文档转换为Excel、将Word...
- 绝了!一键用AI生成高颜值动态PPT(附详细步骤+Prompt)
-
大家好,我是一名酷爱研究AI的产品经理,最近我有个新发现:那些花了你3天做出来的PPT,现在用AI可以1小时搞定!而且颜值还高!为什么AI做PPT比传统方式效率高10倍?我用一张图就能告诉你:AI生成...
- ztext - 简单几行代码创建酷炫3D特效文字的开源JS库
-
把网页上的文字变成酷炫的3D风格,还能制作旋转动效,有了ztext.js,只需要几行代码。ztext能做什么ztext.js是一个能把常规的平面文字变成3D样式的前端开源代码库,让开发者...
- 文字内插入小图片,也太可爱了吧(文字中怎么插图片)
-
图文排版H5手机版秀米有小伙伴留言问添加图片的时候可不可以把图片添加到文字之间比如下面这句话中的小贴纸图片后面可以接着输入文字其实吧这就是咱们的『文字内插入小图片』功能嘛可以用来在文字内加个表情包又...
- Linux环境下C++代码性能分析方法(linux怎么写c++代码)
-
技术背景在开发C++应用程序时,找出代码中运行缓慢的部分是进行性能优化的关键。在Linux系统上,有多种工具和方法可用于对C++代码进行性能分析,每种方法都有其特点和适用场景。实现步骤手动中断调试法在...
- SVG互动图文,让你的文章更有趣!教你4种简单易学的黑科技玩法!
-
如果你是一个公众号创作者,那么你一定想知道如何让你的文章更加吸引人,更加有趣,更加有创意。你可能已经尝试过各种图文排版技巧,但是你是否知道,有一种黑科技可以让你的文章变得更加酷炫,更加互动,更加爆款?...
- Videoscribe怎么实现实心中文汉字的手绘制作
-
很多朋友在制作手绘视频的时候,不知道怎么输入实心的中文汉字,之前我们已经给大家分享了怎么输入汉字的方法,但是有一点遗憾的是输出的汉字是空心的手绘展示,在视觉上并不是非常的美观。经过大家不断的探索,终于...
- 一款用于将文本转化成图表的现代化脚本语言
-
大家好,又见面了,我是GitHub精选君!今天要给大家推荐一个GitHub开源项目terrastruct/d2,该项目在GitHub有超过10.3kStar,用一句话介绍该项目就是:...
- 探秘 Web 水印技术(制作水印网站)
-
作者:fransli,腾讯PCG前端开发工程师Web水印技术在信息安全和版权保护等领域有着广泛的应用,对防止信息泄露或知识产品被侵犯有重要意义。水印根据可见性可分为可见水印和不可见水印(盲水印)...
- 不忍心卸载的五款神仙工具(不忍心卸载的五款神仙工具是什么)
-
001.效率工具uTools-装机必备的生产力工具集uTools是一款非常强大的可以装下几乎所有效率工具的电脑生产力工具集,目前拥有Windows、Mac和Linux三个版本。软件界面...
- 「SVG」飞花令!这份最高检工作报告“超有料”
-
原标题:【SVG】飞花令!这份最高检工作报告“超有料”栏目主编:秦红文字编辑:沈佳灵来源:作者:最高人民检察院...
- svg|2025政府工作报告,有没有你关心的数据?
-
··<setattributeName="visibility"begin="click+0s"dur="1ms"fill="freeze"restart="never"to="hi...
- videoscribe只能输入英文,如何输入中文文本?
-
videoscribe只能输入英文,如何输入中文文本?打开VideoScribe软件,打开要添加中文字体的位置。打开Photoshop并在文件中创建一个新的透明背景图层。注意:必须是透明背景层。...
- 五个流行的SVG在线编辑器(svg编辑工具)
-
随着响应网络的发展,越来越多的高质量的SVG在线编辑器被公众所熟知。SVG矢量图形也越来越受欢迎,以便在任何设备上呈现图像,甚至一些易于使用的SVG在线编辑器,可以替代PS,本文总结了五种流行的SVG...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 选择器 (30)
- CSS 轮廓 (30)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 中级教程 (30)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)