百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

python自动化工具:pywinauto(pythonapp自动化)

myzbx 2025-04-08 16:43 15 浏览

简介

Pywinauto是完全由Python构建的一个模块,可以用于自动化 Windows 上的 GUI 应用程序。同时,它支持鼠标、键盘操作,在元素控件树较复杂的界面,可以辅助我们完成自动化操作。

我在工作中,主要是使用pywinauto来辅助做一些操作,来完成自动化测试。

pywinauto安装

先要确认本地有python环境,然后可以通过命令行安装pywinauto:

Bash
pip install pywinauto

如果你是使用ide,可以通过ide安装,比如我习惯使用pycharm,就可以在Project Interpreter中添加pywinauto:

还有一些手动安装的方法,但是有点繁琐,不是很推荐,这里就不介绍了。

访问技术选择

Pywinauto要操作应用,首先需要访问应用,主要有两种访问技术。WIN32访问技术支持MFC、VB6、VCL、简单WinForms控件开发的应用,MS UI Automation访问技术支持WinForms、WPS、QT5、WPF、Store apps、browsers等开发的应用。

win32 API的backend为「 win32 」,MS UI Automation的backend为「 uia 」。

Pywinauto中使用的backend默认为win32。可使用spy++或者Inspect工具判断backend适合选哪种。例如:如果使用py_inspect的uia模式,可见的控件和属性更多的话,backend可选uia,反之,backend可选win32。

这里提一下常用的分析工具:

  • SPY++,用于WIN32 API。当SPY++可以显示所有的控件时,访问技术应该选择"win32"。
  • Inspect.exe:如果Inspect.exe的模式设置为UIA模式,可以比SPY++显示更多的控件,则访问技术应该选择"uia"。
  • py_inspect:支持win32和uia两种访问技术,是SWAPY的替代。
  • UISPY:支持uia访问技术。
  • SWAPY:只支持win32访问技术。

我个人常用的是py_inspect和spy++。

打开应用

多数情况下都是需要打开应用的,实现方式也很简单:

Bash
app = Application(backend='uia').start('D:\WireShark\Wireshark.exe')

backend参数根据实际情况选择传uia还是win32。

start方法其实可以传两个参数,除了目标应用的启动程序地址,还可以传一个timeout,如果不传,默认是5s。如果你的目标程序启动、运行都很慢,可以将timeout设置久一点。

连接应用

如果要操控的应用已经处于启动状态,可以直接进行连接,而连接方式有多种可以选择:

# 通过应用完整路径
app = Application(backend='uia').connect(path="D:\WireShark\Wireshark.exe")
# 通过应用进程pid进行连接
app = Application(backend='uia').connect(process=pid)

其中Windows的pid可以通过任务管理器进行查看:

# 通过窗口句柄
app = Application(backend='uia').connect(handle=175)

但是我在实际操作的时候使用窗口句柄没有成功过,可能是我使用姿势不对,不过还是不推荐使用窗口句柄。

# 通过组合参数
app = Application(backend='uia').connect(title_re='Wire', class_name='MainWindow')

title_re参数传递的是应用的部分名称,class_name可以通过py_inspect查询到。

window,dialog定位

前面获取的对象都是应用,但是我们实际操作的是应用窗口,这里就来介绍怎么获取窗口和对话框。

最常用的是通过title定位:

window = app.window(title='Wireshark')

如果不清楚定位工具中的title在哪个位置,显示的是什么,可以通过print_control_identifiers()方法将所有的title都打印出来:

通过title定位的时候需要注意一下中英文的影响,如果是中文,可能会有编码问题,需要转码。

title其实只是window()方法中的一种关键字参数,window()方法可以接收很多中的关键字参数,且这些参数可以组合使用,例如这样:

window = app.window(title='Wireshark', class_name='MainWindow')

主要参数有这些:

  • class_name:ClassName
  • class_name_re:正则匹配window Classname
  • title:Name Window窗口名
  • title_re:正则匹配窗口名
  • best_match:模糊匹配类似的title
  • handle:句柄
  • framework_id:FrameworkId(一般情况下FrameworkId不是唯一的)
  • process:ProcessId,进程id(注意:每次启动后,进程id都会变)
  • control_id:在py_inspect可以查询到
  • control_type:在py_inspect可以查询到
  • auto_id:在py_inspect可以查询到

通过top_window()也能比较容易地获取到窗口,但是这个方法获取的是程序的顶级窗口,但可能不是Z-Order中的顶级窗口。所以这个方法使用的时候多调试几次。

窗口操作

窗口的操作主要有最小化、最大化、恢复、关闭窗口:

# 最小化窗口
dlg.minimize()
 
# 最大化窗口
dlg.maximize()
 
# 恢复窗口
dlg.restore()
 
# 关闭窗口
dlg.close()

control定位

控件的定位其实和窗口的定位基本一致,不太清楚为什么pywinauto在设计的时候会将窗口和控件作为一类东西。

相对于前面定位窗口的window()方法,定位控件的时候推荐使用child_window(),因为直接使用windows()的话,如果控件不是在当前窗口的子控件,是子子控件,就会定位不到,而child_window()方法就不会有这个问题,当然相对的缺点就是当控件深度太深的时候,执行这个方法会比较耗时。

child_window()方法传递的参数和window()是一样的。

控件操作

控件自带了一些操作方法:

# 单击
click_input() 
# 双击
double_click_input  
# 右击
right_click_input  

当这些不好用的时候,比如你的控件不支持点击,但是你又想点击一下,可以使用鼠标操作的一些方法:

# 导入鼠标方法
from pywinauto import mouse
# 点击鼠标左键,coords传的是像素位置
mouse.click(coords=(x,y))
# wheel_dist:为正向上滚动,为负向下滚动
mouse.mouse.scroll(coords=(x,y),wheel_dist=-1)

截图

测试过程中可能会需要截图作为证据,截图的方法也比较简单:

button = app.window(best_match='Unsaved').child_window(best_match='Cancel')
if button.exists(): 
		button..capture_as_image().save(img_path)

模拟键盘的操作

pywinauto也提供了键盘操作的方法:

# 导入键盘方法
from pywinauto.keyboard import *
# 全选
send_keys("^a") 
# “+”:Shift
# “^”:Ctrl
# “%”:Alt

等待机制

pywinauto有几个设置等待时间的方式,这里介绍一个:

# 等待窗口,超时时间是10s,重试1次
window.wait(wait_for='ready',timeout=10,retry_inteval=1)

实战

这里简单的演示一下用Wireshark自动抓包并保存:

import time

from pywinauto import Application, Desktop, mouse
from pywinauto.keyboard import send_keys


def click_control(control):
    control_rect = control.rectangle()
    top = control_rect.top
    bottom = control_rect.bottom
    left = control_rect.left
    right = control_rect.right
    mouse.click(coords=(int((left+right)/2), int((top+bottom)/2)))

app = Application(backend='uia').start('D:\WireShark\Wireshark.exe')
window = app.window(best_match='Wireshark')
time.sleep(5)
window.set_focus()
app.window(best_match='Wireshark').child_window(best_match='WLAN').double_click_input()
time.sleep(5)
app.window(best_match='正在捕获').child_window(best_match='停止').click_input()
app.window(best_match='*WLAN').child_window(best_match='文件').click_input()
app.window(best_match='*WLAN').child_window(best_match='另存为').click_input()
click_control(app.window(best_match='*WLAN').child_window(best_match='文件名(N)'))
send_keys('aaa')
app.window(best_match='*WLAN').child_window(best_match='保存').click_input()

总结

PC端自动化测试使用到的python模块主要有pywinauto、win32gui、pyautogui。这里介绍的pywinauto主要使用到Application类,用于应用程序管理(打开与关闭应用等)、窗口管理(最小化、最大化、关闭窗口)、控件操作。

pywinauto的功能其实挺丰富的,但是真正用到的其实只是其中很小的一块,感兴趣的同学可以多去官网翻一翻。

相关推荐

java基础都在这了,小主们拿去吧(java基础总结大全)

-----面向对象---------面向对象和面向过程的区别?面向对象是把构成问题事务分解成各个对象,建立对象的目的不是为了完成一个步骤,而是为了描述某个事务在整个问题中的行为。面向过程是分析出解决问...

Java 8:一文掌握 Lambda 表达式 | CSDN 博文精选

作者|Android大强哥责编|郭芮出品|CSDN博客本文将介绍Java8新增的Lambda表达式,包括Lambda表达式的常见用法以及方法引用的用法,并对Lambda...

如何理解Python类中的self?(python方法中self.属性)

许多python初学者,在接触到python面向对象的时候,就被类中包含的方法中的self打败了,不知道self是何物?既然写在方法中,是必须参数,为何在调用方法的时候不给它传参数还能正常运行?和我们...

javascript的this用法(javascript中的this)

this是Javascript语言的一个关键字。它代表函数运行时,自动生成的一个内部对象,只能在函数内部使用。比如,functiontest(){this.x=1;}随着函数使用场合的不同,th...

JavaScript 的 this 原理是什么?(js中this的含义)

JavaScript中的this是一个关键字,代表当前执行代码的上下文对象。它的值在运行时确定,根据不同的调用方式和执行环境,this的值也会发生变化。具体来说,this的取值规则如下:如果...

小白学习Java开发如何入门?你可能需要这份学习路线图

21世纪进入信息时代,信息科技给人类的生产和生活方式带来了深刻的变革,信息产业已成为推动国家经济发展的主导产业之一,Java作为含金量极高的一门IT技术,很多人希望从事这个行业,那么想学好Java,要...

Java类与对象知识点总结(java第十一章类和对象)

#头号有新人##java#1.类与对象java是一门纯面向对象的语言,在java面向对象的世界里,一切皆为对象。面向对象是解决问题的一种思想,主要是要依靠对象之间的交互完成一件事情。用面向对象的思想...

JavaScript面试题精选:10个高频问题详解

引言JavaScript是现代Web开发的支柱。无论您是在准备面试还是复习知识,这里有10个经常被问到的JavaScript问题,配有简洁准确的答案。1.var、let和const有什么区别?v...

三石说:java基础 类与对象(java类和对象总结)

类:类是封装对象的行为和属性的载体,具有相同属行和行为的一类实体。类中包含方法和属性。类中的构造方法:1.构造方法没有返回值2.名称与类名相同,在构造方法中可以为成员变量赋值,也就是初始化成员变量,若...

C#自学——委托、LINQ(c#中委托)

委托的概念委托是一种可以指向方法的数据类型(委托类型),可以声明委托类型的变量数据类型指的是类似类的,前面提到过一切皆对象,委托就是将方法当作对象使用声明委托delegate返回值类型委托类型名称...

JVM(三)对象的生死判定和算法详解

导读:对象除了生死之外,还有其他状态吗?对象真正的死亡,难道只经历一次简单的判定?如何在垂死的边缘“拯救”一个将死对象?判断对象的生死存活都有那些算法?本文带你一起找到这些答案。在正式开始之前,我们先...

这几道面试题,可以考考自己(面试真题去哪里找)

选择几道主流面试题,让大家自我检验一下,理论与实践相结合,才能更容易拿到高薪。Copy如何在.NET中做deepcopy?1)使用序列化反序列化对象实现深度克隆2)使用反射实现深度克隆trycat...

掌握 C# 和 .NET:常用术语与概念(c#用于什么)

在群里看到一则招聘信息,《基本功扎实,对DDD、OO、IOC、AOP等有深刻认识,熟悉常用设计模式。》OO是什么??查了一下原来OO原来指的是面向对象编程(OOP),于是就总结了一些常用的术语...

Java新特性:Lambda表达式(java lambda表达式的3种简写方式)

1、Lambda表达式概述1.1、Lambda表达式的简介Lambda表达式(Lambdaexpression),也可称为闭包(Closure),是Java(SE)8中一个重要的新特性。Lam...

JS的this指向问题(js如何改变this指向)

一句话概括this指向:谁调用this就指向谁这句话可能太过广义,那么请看以下的各种this指向场景1.箭头函数(=>)箭头函数this的指向不会发生改变,也就是说在创建箭头函数时就已经确定了...