百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

基于Transformers.js的图片任意元素分割

myzbx 2025-04-08 16:46 16 浏览

本文由ScriptEcho平台提供技术支持

项目地址:传送门

图片任意元素分割

应用场景介绍

该代码实现了一个基于Hugging Face Transformers.js库的图片任意元素分割功能。用户可以上传或选择一张图片,然后通过点击和右键单击在图片上标记出想要分割的区域。该代码使用CLIP模型对图片进行编码,并生成一张分割掩码,其中分割的区域用绿色填充。用户可以进一步使用该掩码来切割出图片中的特定元素。

代码基本功能介绍

该代码的主要功能包括:

  • **图片上传和选择:**用户可以上传一张图片或选择一个示例图片。
  • **图片编码:**使用CLIP模型对图片进行编码,提取图片的嵌入。
  • **分割掩码生成:**根据用户的点击和右键单击,生成一张分割掩码,其中分割的区域用绿色填充。
  • **分割区域切割:**用户可以点击“剪切遮罩”按钮,将分割的区域切割出来并下载为PNG图片。

功能实现步骤及关键代码分析说明

1. 初始化

onMounted(async () => {
    // Reference the elements we will use
    const statusLabel = document.getElementById('status');
    const fileUpload = document.getElementById('upload');
    const imageContainer = document.getElementById('container');
    const example = document.getElementById('example');
    const maskCanvas = document.getElementById('mask-output');
    const uploadButton = document.getElementById('upload-button');
    const resetButton = document.getElementById('reset-image');
    const clearButton = document.getElementById('clear-points');
    const cutButton = document.getElementById('cut-mask');

// ...

在onMounted钩子中,我们首先引用了所有必要的元素。

2. 创建Web Worker

    // Create a web worker so that the main (UI) thread is not blocked during inference.
    const worker = new Worker('/src/pages/test/ai/transformersjs/sam-worker.js', {
        type: 'module',
    });

我们创建一个Web Worker来处理图片编码和分割掩码生成,以避免阻塞主线程。

3. 消息处理程序

    // Set up message handler
    worker.addEventListener('message', (e) => {
        const { type, data } = e.data;
        if (type === 'ready') {
            modelReady = true;
            statusLabel.textContent = '已完成';

    } else if (type === 'decode_result') {
        // ...
    } else if (type === 'segment_result') {
        // ...
    }
});

我们为Web Worker设置一个消息处理程序,用于处理从Web Worker接收到的消息。

4. 图片编码

function segment(data) {
    // ...

// Instruct worker to segment the image
worker.postMessage({ type: 'segment', data });

}

segment函数用于将图片发送到Web Worker进行编码。

5. 分割掩码生成

function decode() {
    // ...

worker.postMessage({ type: 'decode', data: lastPoints });

}

decode函数用于将用户点击和右键单击的点发送到Web Worker,以生成分割掩码。

6. 分割区域切割

    // Handle cut button click
    cutButton.addEventListener('click', () => {
        // ...

    // Create a new canvas to hold the cut-out
    const cutCanvas = new OffscreenCanvas(w, h);
    const cutContext = cutCanvas.getContext('2d');
    const cutPixelData = cutContext.getImageData(0, 0, w, h);

    // ...

    // Download image
    const link = document.createElement('a');
    link.download = 'image.png';
    link.href = URL.createObjectURL(await cutCanvas.convertToBlob());
    link.click();
    link.remove();
});

cutButton的点击事件处理程序用于切割出分割的区域并下载为PNG图片。

总结与展望

开发这段代码过程中的经验与收获

  • 学习了如何使用Hugging Face Transformers.js库进行图片编码和分割。
  • 了解了如何在Vue.js中使用Web Worker。
  • 掌握了如何处理用户交互事件和更新UI。

未来该卡片功能的拓展与优化

  • 添加对多张图片分割的支持。
  • 探索使用其他分割模型,如U-Net。
  • 集成图像编辑功能,如裁剪和旋转。
  • 优化Web Worker的性能。
  • 更多组件:

获取更多Echos

本文由ScriptEcho平台提供技术支持

项目地址:传送门

相关推荐

怎么恢复7z文件 7z文件删除了怎么恢复

7z是一种压缩格式的文件,它运用LZMA压缩算法,该压缩算法的输出稍后被算数编码进行处理以便后续进一步压缩,压缩比十分高。我们可以将文件压缩成这种格式,便于传输,保存,占空间少。了解更多7z文件知识...

郎酒让消费者喝得明明白白 算术题里有答案

日前,『郎酒酱香产品企业内控准则』颁布,郎酒首次公开酱香产品生产全过程,公布酱香产品产能、储能及投放计划。随后,郎酒官微向消费者发出「品控算术题」有奖问答。郎酒亮出家底,消费者踊跃留言。8天后,谜底揭...

学龄前,比识字、算术更重要的是这三件事

“为了给孩子选择一家合适的幼儿园,我曾穿梭于纽约各家幼儿园的开放日,这些幼儿员既包括主流的公立幼儿园,还包括那些遥不可及的私人幼儿园。我的目的就是想了解他们的教育理念是什么,到底厉害在哪里,看看对于我...

参加CSP-J信奥赛需要掌握数学知识

在C++语法的学习中需要储备的数学知识如下①数据类型:需要知道整数、正整数、负整数、小数、判断对错②算术运算符:加法、减法、乘法、除法、取模运算③关系表达式:大于、大于等于、小于、小...

1g米饭能做多少深蹲?今天我们来算一算

减重我们都知道3分在练,7分在吃,吃这件事情上,真的是每一口都算数。今天我们来算一笔账,1粒米饭可以做多少事情?本着认真负责的态度,今天在食物秤上称了1g米饭,是16粒。根据能量换算:100g米饭是4...

web 自动化测试,一定得掌握的 8 个核心知识点

使用cypress进行端对端测试,和其他的一些框架有一个显著不同的地方,它使用JavaScript作为编程语言。传统主流的selenium框架是支持多语言的,大多数QA会的pytho...

大话C语言:赋值运算符(c语言中赋值运算符是什么)

赋值运算符是最基本的运算符之一,用于将右侧的值或表达式的计算结果赋给左侧的变量。它是一个二元运算符,意味着它需要两个操作数:一个是目标变量(左侧),另一个是要赋给该变量的值或表达式(右侧)。赋值运算符...

Vue进阶(幺幺伍):js 将字符串转换为boolean

Boolean();参数为0、null和无参数返回false,有参数返回true。Boolean("");//输出为:falseBoolean(null);//输出为...

mongodb查询的语法(大于,小于,大于或等于,小于或等于等等)

1).大于,小于,大于或等于,小于或等于$gt:大于$lt:小于$gte:大于或等于$lte:小于或等于例子:db.collection.find({"field":{$gt:valu...

Python学不会来打我(21)python表达式知识点汇总

在Python中,表达式是由变量、运算符、函数调用等组合而成的语句,用于产生值或执行特定操作。以下是对Python中常见表达式的详细讲解:1.1算术表达式涉及数学运算的表达式。例如:a=5b...

C|数据存储地址与字节偏移、数据索引

话说C是面向内存的编程语言。数据要能存得进去,取得出来,且要考虑效率。不管是顺序存储还是链式存储,其寻址方式总是很重要。顺序存储是连续存储。同质结构的数组通过其索引表示位置偏移,异质结构的结构体通过其...

下班后累懵?4 个 JS 手写题帮你搞定前端面试高频考点

打工人下班后最痛苦的事,莫过于拖着疲惫的身子还要啃前端面试题吧?看着那些密密麻麻的JS代码,脑子都快转不动了!别担心,今天咱就用轻松的方式,带你吃透4道高频手写题,让你在面试时自信满满,再也不...

嵌入式数据库sqlite3【进阶篇】-子句和函数的使用,小白一文入门

sqlite在《嵌入式数据库sqlite3命令操作基础篇-增删改查,小白一文入门》一文中讲解了如何实现sqlite3的基本操作增删改查,本文介绍一些其他复杂一点的操作。比如where、orderby...

前缀表达式与后缀表达式(前缀表达式后缀表达式中缀表达式计算)

昨天晚上和儿子一起学习了前缀表达式和后缀表达式。这应该是字符串算式如何被计算机识别并计算的2种方法。本来是想先给他讲一个逆波兰式(后缀表达式),以后再讲前缀表达式。没想到他还挺聪明,很快就把2个都掌握...

Python快速入门教程1:基本语法、数据类型、运算符、数字字符串

Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、运算符、数字和字符串等内容,并附有使用实例场景。Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、...