百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

WebGPU:现代浏览器正式解锁GPU访问

myzbx 2025-04-08 16:45 20 浏览

大家好,我是Echa。

好消息,WebGPU 组织正式宣布:现代浏览器正式解锁GPU访问。

前段时间小编整理的关于《重磅!谷歌正式发布 WebGPU》这篇文章,一经发布短短一个小时阅读量就高达1w阅读量,持续8个小时累计阅读量5.5w,非常受广大好友欢迎,在科技领域也算是爆款了。有兴趣的小伙伴们可以回头看看。

现在新的 WebGPU API 在图形和机器学习工作负载方面实现了巨大的性能提升。本文将探讨 WebGPU 如何改进当前 WebGL 解决方案,并展望未来的发展方向。

全文大纲

  1. WebGL 的起源
  2. WebGPU 背景
  3. 什么是 WebGPU?
  4. 解锁用于渲染的新 GPU 工作负载
  5. 更快的 ML 推理
  6. 首先为 Web JavaScript 设计
  7. WebGPU总结

WebGL 的起源

官网:
https://www.khronos.org/webgl/

说起起源,就不得不说OpenGL。

在个人计算机的早期,使用最广泛的 3D 图形渲染技术是 Direct3D 和 OpenGL。Direct3D 是微软 DirectX 技术的一部分,主要用于 Windows 平台。OpenGL作为一种开源的跨平台技术,赢得了众多开发者的青睐。

然后是一个特殊的版本——OpenGL ES。它专为嵌入式计算机、智能手机、家用游戏机和其他设备而设计。它从 OpenGL 中删除了许多旧的和无用的特性,同时添加了新特性。比如去掉矩形等多余的多边形,只保留点、线、三角形等基本图形。这使它能够保持轻量级,同时仍然足够强大以渲染漂亮的 3D 图形。

而 WebGL 是从 OpenGL ES 衍生而来的。它专注于 Web 的 3D 图形渲染。

下图显示了它们之间的关系:

WebGPU 背景

官网:http://webgpu.io/

WebGL 于 2011 年登陆 Chrome。通过允许 Web 应用利用 GPU,WebGL 可以在 Web 上实现惊人的体验——从 Google 地球到交互式音乐视频,再到 3D 房地产等等。WebGL是基于OpenGL系列API开发的,该API最初开发于1992年,自那时以来 GPU 硬件已经发生了极大的变化。

为跟上这一进步,一种新型的API被开发出来,以更高效地与现代GPU硬件交互。这些API包括Direct3D 12、Metal和Vulkan。这些新的 API 支持GPU编程的新的和苛刻的用例,例如机器学习的爆炸式增长和渲染算法的进步。WebGPU 是 WebGL 的继承者,将这种新型现代 API 的进步带到了 Web。

WebGPU 在浏览器中解锁了许多新的 GPU 编程可能性。它更好地反映了现代 GPU 硬件的工作方式,并为未来更高级的GPU功能奠定了基础。自2017年以来,这个API已经在W3C的“Web GPU”小组中不断完善,并得到了包括苹果、谷歌、Mozilla、微软和英特尔在内的众多公司的合作。经过 6 年的努力,很高兴地宣布,这项对 Web 平台最大的增强功能终于可用了!

WebGPU 现在可以在 Chrome OS、macOS和Windows上的Chrome 113中使用,其他平台也将会很快推出。

什么是 WebGPU

WebGPU 的目的是提供现代 3D 图形和计算能力。它是前端的老朋友W3C组织制定的标准。与 WebGL 不同,WebGPU 不是 OpenGL 的包装器。相反,它指的是当前的图形渲染技术,一种新的跨平台高性能图形界面。

它的设计更容易被三大图形框架实现,减轻了浏览器开发者的负担。它是一个精确的图形API,完全开放了整个显卡的能力。不再是像 WebGL 这样的上层 API。

更具体的优点如下:

  • 减少 CPU 开销
  • 对多线程的良好支持
  • 使用计算着色器将通用计算 (GPGPU) 的强大功能引入 Web
  • 全新的着色器语言——WebGPU Shading Language (WGSL)
  • 未来将支持“实时光线追踪”的技术


这里我挑出多线程支持来详细说一下:

在 WebGL 中,你可以使用 OffscreenCanvas 进行多线程处理,但 Safari 尚不支持此功能。而且它的操作也很有限,你必须将整个 Canvas 的所有操作都转移到单个 Worker 上。

webGPU 上下文可以由多个工作人员共享。这些worker只要在时间线上没有互斥操作,都可以正常运行。这无疑带来了良好的开发体验。

这是因为 WebGL 全局状态的设置。它在设置状态后立即执行,这使得 WebGL 无法支持多线程。

而WebGPU用来Pipeline Object设置渲染管线中的相关信息。它分为两个阶段:“记录命令”和“提交命令”。

“记录命令”是一个纯 CPU 进程。可以分别记录在多个worker(多线程)中,然后提交到同一个队列中。

“提交命令”就是让GPU根据队列中的命令顺序执行。

下面来看一些令人兴奋的 WebGPU 使用案例。

解锁用于渲染的新 GPU 工作负载

诸如计算着色器之类的 WebGPU 功能使新类别的算法能够移植到 GPU 上。例如,可以为场景添加更多动态细节、模拟物理现象等算法!甚至以前只能用 JavaScript 完成的工作负载现在可以转移到 GPU 上。

以下视频显示了用于对这些圆球表面进行三角测量的行进立方体算法。在视频的前 20 秒内,当该算法在 JavaScript 中运行时,它很难跟上仅以 8 FPS 运行的页面,从而导致动画卡顿。为了在 JavaScript 中保持高性能,需要大量降低细节级别。

当我们将相同的算法移动到计算着色器时,这是一个白天和黑夜的区别,这在 20 秒后的视频中可以看到。性能显著提高,页面现在以 60 FPS 的流畅速度运行,并且对于其他效果仍有很大的性能提升空间。此外,页面的主要 JavaScript 循环完全释放出来用于其他任务,确保与页面的交互保持响应。


WebGPU 还可以实现以前不实用的复杂视觉效果。在以下示例中,在流行的 Babylon.js 库中创建,海洋表面完全在 GPU 上模拟。逼真的动态是由许多相互添加的独立波创建的。但是直接模拟每个波浪太昂贵了。


这就是演示使用称为快速傅立叶变换的高级算法的原因。这不是将所有波表示为复杂的位置数据,而是使用更有效地执行计算的光谱数据。然后每一帧使用傅立叶变换将光谱数据转换为代表波浪高度的位置数据。

更快的 ML 推理

WebGPU 还可用于加速机器学习,这已成为近年来 GPU 的主要用途。

长期以来,创发人员一直在重新利用 WebGL 的渲染 API 来执行非渲染操作,例如机器学习计算。然而,这需要绘制三角形的像素作为启动计算的一种方式,并仔细打包和解包纹理中的张量数据,而不是更通用的内存访问。


以这种方式使用 WebGL 需要开发人员笨拙地使他们的代码符合专为绘图而设计的 API 的期望。再加上缺乏计算之间的共享内存访问等基本功能,这会导致重复工作和次优性能。

计算着色器时 WebGPU 的主要新功能,可以消除这些痛点。计算着色器提供更灵活的编程模型,利用 GPU 的大规模并行特性,同时不受严格的渲染操作结构的限制。


计算着色器为在着色器工作组内共享数据和计算结果提供了更多机会,以提高效率。与之前出于相同目的使用 WebGL 的尝试相比,这可能会带来显著的收益。

作为这可以带来的效率提升的一个例子,TensorFlow.js 中图像扩散模型的初始端口显示,当从 WebGL 移动到 WebGPU 时,各种硬件的性能提升了 3 倍。在一些测试过的硬件上,图像渲染时间不到 10 秒。因为这是一个早期的端口,相信 WebGPU 和 TensorFlow.js 都有更多改进的可能!

但 WebGPU 不仅仅是将 GPU 功能带到 Web 上。

首先为 Web JavaScript 设计

WebGPU是在对WebGL开发人员十年的工作经验进行反思的基础上开发的。将他们遇到的问题、遇到的瓶颈和提出的问题整理出来,并将所有反馈汇总到这个新的API中。

WebGL 的全局状态模型使得创建强大、可组合的库和应用变得困难和脆弱。因此,WebGPU大大减少了开发人员需要跟踪GPU命令时需要跟踪的状态数量。

调试 WebGL 应用是很痛苦的,因此WebGPU包括了更灵活的错误处理机制,不会降低性能。而且确保从API中获得的每条消息都易于理解和可操作。

频繁调用过多的 JavaScript 函数会成为复杂 WebGL 应用的瓶颈。因此,WebGPU API 的通信量较少,因此可以用更少的函数调用完成更多的任务。专注于在前期执行重量级验证,尽可能使关键的绘制循环精简。提供了像渲染捆绑一类的新 API,它允许预先记录大量的绘图命令,并以单个调用重播它们。

为了展示像渲染捆绑这样一个功能会带来多么大的变化,下面是Babylon.js的另一个演示。他们的 WebGL 2 渲染器可以每秒执行约 500次 JavaScript 调用以呈现这个美术馆场景。


WebGL 2


WebGPU

然而,他们的 WebGPU 渲染器启用了一项称为快照渲染的功能。此功能构建在 WebGPU 渲染包之上,可使提交相同场景的速度提高 10 倍以上。这种显著减少的开销使 WebGPU 能够呈现更复杂的场景,同时还允许应用使用 JavaScript 并行执行更多操作。

现代图形 API 以复杂性、以简单性换取极端优化机会而著称。另一方面,WebGPU 专注于跨平台兼容性,在大多数情况下自动处理资源同步等传统难题。

WebGPU 易于学习和使用。它依赖于网络平台的现有功能来进行图像和视频加载等操作,并依赖于众所周知的 JavaScript 模式,例如用于异步操作的 Promises。这有助于将所需的样板代码数量保持在最低限度。可以用不到 50 行代码在屏幕上显示第一个三角形。


<script type="module">
  const adapter = await navigator.gpu.requestAdapter();
  const device = await adapter.requestDevice();

  const context = canvas.getContext("webgpu");
  const format = navigator.gpu.getPreferredCanvasFormat();
  context.configure({ device, format });

  const code = `
    @vertex fn vertexMain(@builtin(vertex_index) i : u32) ->
      @builtin(position) vec4f {
       const pos = array(vec2f(0, 1), vec2f(-1, -1), vec2f(1, -1));
       return vec4f(pos[i], 0, 1);
    }
    @fragment fn fragmentMain() -> @location(0) vec4f {
      return vec4f(1, 0, 0, 1);
    }`;
  const shaderModule = device.createShaderModule({ code });
  const pipeline = device.createRenderPipeline({
    layout: "auto",
    vertex: {
      module: shaderModule,
      entryPoint: "vertexMain",
    },
    fragment: {
      module: shaderModule,
      entryPoint: "fragmentMain",
      targets: [{ format }],
    },
  });
  const commandEncoder = device.createCommandEncoder();
  const colorAttachments = [
    {
      view: context.getCurrentTexture().createView(),
      loadOp: "clear",
      storeOp: "store",
    },
  ];
  const passEncoder = commandEncoder.beginRenderPass({ colorAttachments });
  passEncoder.setPipeline(pipeline);
  passEncoder.draw(3);
  passEncoder.end();
  device.queue.submit([commandEncoder.finish()]);
</script>

WebGPU总结

很高兴看到 WebGPU 为 Web 平台带来的所有新可能性,围绕 WebGL 构建了一个充满活力的库和框架生态系统,并且同样的生态系统渴望拥抱 WebGPU。在许多流行的 Javascript WebGL 库中,对 WebGPU 的支持正在进行中或已经完成,在某些情况下,利用 WebGPU 的优势可能就像更改单个标志一样简单!


Chrome 113 中的第一个版本只是一个开始。虽然初始版本适用于 Windows、ChromeOS 和 MacOS,但计划在不久的将来将 WebGPU 引入其余平台,如 Android 和 Linux。

致力于推出 WebGPU 的不仅仅是 Chrome 团队。Firefox 和 WebKit 的实现也在进行中。

此外,W3C 已经在设计新功能,这些功能在硬件可用时可以公开。例如:在 Chrome 中,计划很快在着色器和 DP4 类指令中启用对 16 位浮点数的支持,以进一步提高机器学习性能。

WebGPU是一个广泛的API,可以释放惊人的性能。本文只能对其优点进行概述,但如果想亲身体验WebGPU,可以查看入门 Codelab《Your first WebGPU app》,将构建经典康威生命游戏的GPU版本。这个 Codelab 会逐步引导完成整个过程,因此即使第一次进行GPU开发,也可以轻松尝试。

WebGPU app:https://codelabs.developers.google.com/your-first-webgpu-app

最后

一台电脑,一个键盘,尽情挥洒智慧的人生;几行数字,几个字母,认真编写生活的美好;

一 个灵感,一段程序,推动科技进步,促进社会发展。

创作不易,喜欢的老铁们加个关注,点个赞,打个赏,后面会不定期更新干货和技术相关的资讯,速速收藏,谢谢!你们的一个小小举动就是对小编的认可,更是创作的动力。

相关推荐

零基础入门AI智能体:详细了解什么是变量类型、JSON结构、Markdown格式

当品牌跳出固有框架,以跨界联动、场景创新叩击年轻群体的兴趣点,一场关于如何在迭代中保持鲜活的探索正在展开,既藏着破圈的巧思,也映照着与新一代对话的密码。在创建AI智能体时,我们会调用插件或大模型,而在...

C# 13模式匹配:递归模式与属性模式在真实代码中的性能影响分析

C#13对模式匹配的增强让复杂数据处理代码更简洁,但递归模式与属性模式的性能差异一直是开发者关注的焦点。在实际项目中,选择合适的模式不仅影响代码可读性,还可能导致执行效率的显著差异。本文结合真实测试...

零基础快速入门 VBA 系列 6 —— 常用对象(工作簿、工作表和区域)

上一节,我介绍了VBA内置函数以及如何自动打字和自动保存文件。这一节,我们来了解一下Excel常用对象。Excel常用对象Excel有很多对象,其中最常用也最重要的包括以下3个:1.Workbo...

不同生命数字的生肖龙!准到雷普!

属龙的人总在自信爆棚和自讨苦吃之间反复横跳?看完这届龙宝宝的日常我悟了。属龙的人好像天生自带矛盾体:领导力超强可人缘时好时坏,工作雷厉风行却总在爱情里翻车。关键年份的龙性格差异更大——76年龙靠谱但不...

仓颉编程语言基础-面向对象编程-属性(Properties)

属性是仓颉颉中一种强大的机制,它允许你封装对类(或接口interface、结构体struct、枚举enum、扩展extend)内部状态的访问。它看起来像一个普通的成员变量(字段),但在其背后,它通过...

Python中class对象/属性/方法/继承/多态/魔法方法详解

一、基础入门:认识类和对象1.类和对象的概念在Python中,类(class)是一种抽象的概念,用于定义对象的属性和行为,而对象(也称为实例)则是类的具体表现。比如,“汽车”可以是一个类,它有...

VBA基础入门:搞清楚对象、属性和方法就成功了一半

如果你刚接触VBA(VisualBasicforApplications),可能会被“对象”“属性”“方法”这些术语搞得一头雾水。但事实上,这三个概念是VBA编程的基石。只要理解它们之间的关系,...

P.O类型文推荐|年度编推合集(一百九十五篇)

点击左上方关注获取更多精彩推文目录2019年度编推35篇(1V1)《悖论》作者:流苏.txt(1V1)《桂花蒸》作者:大姑娘浪.txt(1V1)《豪门浪女》作者:奚行.txt...

Python参数传递内存大揭秘:可变对象 vs 不可变对象

90%的Python程序员不知道,函数参数传递中可变对象的修改竟会导致意想不到的副作用!一、参数传递的本质:对象引用传递在Python中,所有参数传递都是对象引用的传递。这意味着函数调用时传递的不是对...

JS 开发者必看!TC39 2025 最新动向,这些新语法要火?

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力。TC39第...

2025 年值得尝试的 5 个被低估的 JavaScript 库

这些JavaScript库可能不会在社交媒体或HackerNews上流行起来,但它们会显著提高您的工作效率和代码质量。JavaScript不再只是框架。虽然React、Vue和Sv...

Python自动化办公应用学习笔记30—函数的参数

一、函数的参数1.形参:o定义:在函数定义时,声明在函数名后面括号中的变量。o作用:它们是函数内部的占位符变量,用于接收函数被调用时传入的实际值。o生命周期:在函数被调用时创建,在函数执...

16种MBTI人格全解析|测完我沉默了三秒:原来我是这样的人?

MBTI性格测试火了这么久,你还不知道自己是哪一型?有人拿它当社交话题,有人拿它分析老板性格,还有人干脆当成择偶参考表。不废话,今天我一次性给你整理全部16种MBTI人格类型!看完你不仅能知道自己是谁...

JS基础与高级应用: 性能优化

在现代Web开发中,性能优化已成为前端工程师必须掌握的核心技能之一。本文从URL输入到页面加载完成的全过程出发,深入分析了HTTP协议的演进、域名解析、代码层面性能优化以及编译与渲染的最佳实践。通过节...

爱思创CSP-J/S初赛模拟赛线上开赛!助力冲入2024年CSP-J/S复赛!

CSP-J/S组初赛模拟赛爱思创,专注信奥教育19年,2022年CSP-J/S组赛事指定考点,特邀NOIP教练,开启全真实CSP-J/S组线上初赛模拟大赛!一、比赛对象:2024年备考CSP-J/S初...