百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Selenium、Playwright、Puppeteer 如何测试淘宝商城

myzbx 2025-09-29 08:31 18 浏览

做一个实战级的分析,看看 Selenium、Playwright、Puppeteer 如何测试淘宝商城(以登录、搜索、商品详情验证为例),并结合三者的特性给出详细实例与对比。


1 测试目标与挑战

目标场景

  • 打开淘宝首页
  • 登录(模拟输入账号密码或加载已保存的登录状态)
  • 搜索关键词(如“手机”)
  • 验证搜索结果页是否包含相关商品
  • 点击进入商品详情页,验证标题与价格元素存在

挑战点

  • 淘宝有登录验证码反爬虫机制(需处理滑块、二维码等)
  • 页面元素动态加载(需显式/隐式等待)
  • 跨浏览器兼容(Selenium、Playwright可多浏览器,Puppeteer偏Chromium)
  • 可能需要模拟真实用户行为(鼠标移动、滚动、延时)

2 Selenium 实例(Python)

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
import time

# 配置浏览器
options = Options()
options.add_argument("--start-maximized")
driver = webdriver.Chrome(service=Service(), options=options)

try:
    # 打开淘宝
    driver.get("https://www.taobao.com")

    # 点击登录(这里建议使用扫码或cookie复用,避免验证码)
    driver.find_element(By.LINK_TEXT, "亲,请登录").click()
    time.sleep(10)  # 手动扫码或输入账号密码

    # 搜索商品
    search_box = driver.find_element(By.ID, "q")
    search_box.send_keys("手机")
    search_box.send_keys(Keys.ENTER)

    # 等待结果加载
    time.sleep(3)
    items = driver.find_elements(By.CSS_SELECTOR, ".item.J_MouserOnverReq")
    print(f"找到 {len(items)} 个商品")

    # 点击第一个商品
    if items:
        items[0].click()
        driver.switch_to.window(driver.window_handles[-1])
        title = driver.find_element(By.CSS_SELECTOR, ".tb-main-title").text
        print("商品标题:", title)

finally:
    driver.quit()

特点

  • 语言多样(Java、Python、C#等)
  • 需手动处理验证码或复用登录状态
  • 适合已有 Selenium 测试体系的团队

3 Playwright 实例(Python,同步 API)

from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    browser = p.chromium.launch(headless=False)
    context = browser.new_context(storage_state="auth.json")  # 复用登录状态
    page = context.new_page()

    # 打开淘宝
    page.goto("https://www.taobao.com", timeout=60000)

    # 如果未登录,可手动扫码一次并保存状态
    # page.click("text=亲,请登录")
    # page.wait_for_timeout(10000)
    # context.storage_state(path="auth.json")

    # 搜索
    page.fill("#q", "手机")
    page.keyboard.press("Enter")

    # 等待结果
    page.wait_for_selector(".item.J_MouserOnverReq")
    items = page.query_selector_all(".item.J_MouserOnverReq")
    print(f"找到 {len(items)} 个商品")

    # 点击第一个商品
    if items:
        items[0].click()
        page.wait_for_load_state("domcontentloaded")
        print("商品标题:", page.inner_text(".tb-main-title"))

    browser.close()

特点

  • 跨浏览器(Chromium、Firefox、WebKit)
  • 自动等待机制,减少 sleep
  • 支持保存/加载登录状态(绕过验证码)
  • API 现代化,调试工具丰富(Codegen、Trace Viewer)

4 Puppeteer 实例(Node.js)

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch({ headless: false });
  const page = await browser.newPage();

  // 打开淘宝
  await page.goto('https://www.taobao.com', { timeout: 60000 });

  // 点击登录(建议扫码)
  await page.click('text=亲,请登录');
  await page.waitForTimeout(10000); // 手动扫码

  // 搜索
  await page.type('#q', '手机');
  await page.keyboard.press('Enter');

  // 等待结果
  await page.waitForSelector('.item.J_MouserOnverReq');
  const items = await page.$('.item.J_MouserOnverReq');
  console.log(`找到 ${items.length} 个商品`);

  // 点击第一个商品
  if (items.length > 0) {
    await items[0].click();
    await page.waitForSelector('.tb-main-title');
    const title = await page.$eval('.tb-main-title', el => el.innerText);
    console.log('商品标题:', title);
  }

  await browser.close();
})();

特点

  • 专注 Chromium,启动快
  • API 简洁,适合前端团队
  • 对 Chrome DevTools 协议支持原生,调试方便
  • 跨浏览器能力弱(Firefox 支持实验性)

5 三者在淘宝测试的对比

维度

Selenium

Playwright

Puppeteer

浏览器支持

全主流浏览器

Chromium、Firefox、WebKit

Chromium(Firefox 实验性)

语言支持

多语言

JS/TS、Python、Java、C#

JS/TS

验证码绕过

Cookie/手动扫码

Cookie/Storage State

Cookie/手动扫码

等待机制

需显式/隐式等待

自动等待 + 显式等待

显式等待

调试工具

浏览器 DevTools

Codegen、Trace Viewer

Chrome DevTools

适合团队

传统测试团队

新项目、跨浏览器需求

前端/爬虫团队


6 淘宝测试的实战建议

  • 登录环节:淘宝验证码复杂,建议首次手动扫码,保存 Cookie 或 Storage State,后续复用
  • 元素选择器:淘宝 DOM 结构复杂且动态,建议用稳定的 CSS/XPath 或 data-* 属性
  • 反爬虫规避:模拟真实用户操作(滚动、延时、鼠标移动),避免过快执行
  • 跨浏览器测试:Playwright 更优;只测 Chrome 则 Puppeteer 更轻量
  • 集成到 CI/CD:Selenium 与 Playwright 都有较成熟的集成方案

相关推荐

vue3和web网页直接操作微信小程序云开发数据库

我们开发好小程序以后,有时候需要编写一个管理后台网页对数据库进行管理,之前我们只能借助云开发自带的cms网页,但是cms网页设计的比较丑,工作量和代码量也不够,所以我们今天就来带大家实现用vue3编写...

WebCurl:极致轻量的跨平台 HTTP 请求调试工具

在接口开发与测试领域,工具的轻量化、兼容性与安全性往往直接影响工作效率。WebCurl作为一款纯原生、无依赖的网页版API测试与调试工具,凭借极简架构与全场景适配能力,重新定义了接口调试工具的使...

webapi 全流程_webapi项目

C#中的WebAPIMinimalApi没有控制器,普通api有控制器,MinimalApi是直达型,精简了很多中间代码,广泛适用于微服务架构MinimalApi一切都在组控制台应用程序类【Progr...

Nodejs之MEAN栈开发(四)-- form验证及图片上传

这一节增加推荐图书的提交和删除功能,来学习node的form提交以及node的图片上传功能。开始之前需要源码同学可以先在git上fork:https://github.com/stoneniqiu/R...

CodeSpirit.Amis.AiForm 智能表单使用指南

概述AiForm是CodeSpirit.Amis框架的智能表单功能,专为AI驱动的长时间处理任务设计。它自动生成一个多步骤的用户界面,包含表单输入、进度监控、日志显示和结果展示等功能。功能特点...

初级、中级、高级前端工程师,对于form表单实现的区别

在React项目中使用AntDesign(Antd)的Form组件能快速构建标准化表单,特别适合中后台系统开发。以下是结合Antd的最佳实践和分层实现方案:一、基础用法:快速搭...

Bun v0.7 大版本发布,与 Vite 牵手来破局?

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力。今天给大家带来...

「前端」界面可视化开发框架formio.js

简介formio是一个前端可视化开发框架,无需写css/js就可以开发一套前端界面。直接在界面内拖拽就可以完成界面的布局及开发。数据交互也是固定的,表单校验也可以配置,功能非常强大。特性使用ES6...

小伙给同事爬取数据竟获取不到,竟要使用这种请求方式才能获取?

Http请求中FormData和RequestPayload两种参数的区别?AjaxPost请求中常用的两种的形式:formdata和requestpayload一、默认的表单方式...

WinForm + Win32 API 自定义无边框窗口实战(工业软件必备)

前言随着.NET9.0AOT(Ahead-of-Time)的发布,便萌生了用代码测试AOT编译效果的想法,同时评估未来是否为NanUI开发支持AOT编译的新版本。关于NanUI项目,若大家尚未了...

DeepSeek从入门到精通(11)——网页版、APP、API使用方式比较

DeepSeek提供了三种主要的使用方法:网页版、手机APP和API调用。这三种方式各有特点,适用于不同的使用场景。下面从使用方法和主要特点两方面进行比较:一、网页版使用方法:直接通过浏览器访问De...

初略Web API Notification 桌面通知

HTML5WebNotificationsAPI通知接口用于向用户配置和显示桌面通知弹窗。例如,Email邮件通知、来电提醒、聊天信息提醒或任务提醒等。关于Web开发技术中Notificat...

什么是API网关?——驱动数字化转型的“隐形冠军”

什么是API网关API网关(APIGateway)是一个服务器,位于应用程序和后端服务之间,提供了一种集中式的方式来管理API的访问。它是系统的入口点,负责接收并处理来自客户端的请求,然后将请求路由...

.NET 7使用 Entity Framework Core 制作增删改查(CRUD) Web API 教程

在本文中,我们将使用EntityFrameworkCore(EFCore)实现一个.NET7WebAPICRUD示例。WebAPI是一个构建HTTP服务的框架,可以从浏览器、移动设备和...

C# ASP.NET Core Web Api 与 MVC 模式下 body 参数传递,post 参数方式

在ASP.NETCore中,WebAPI和MVC模式在处理HTTP请求时,特别是POST请求,使用body参数来传递数据的方式非常相似。两者都使用模型绑定来自动将请求体中的数据映射到C#对象上。下...