批量图像识别的快速遍历技巧

👆对私有云感兴趣可以进入公众号回复“私有云”哦。

一、前言

最近，不少同学在Q群中频繁提出疑问：在日常UI测试过程中，如何快速准确地识别页面上的多个元素，或在日常测试中，如何高效地遍历目标图片列表，以确认画面中是否包含特定元素？在官方交流Q群2群的lincoln同学给出了不错的方法思路，我们也获得了他的授权，现在我们一起来学习一下这个小技巧吧~

二、方法详解

lincoln同学提供了两个方法函数，其中一个是局部查找，一个是多重查找，我们就来看看他的一个函数逻辑是怎么样的吧。

代码逻辑的核心在于快速地识别目标图像。首先，将目标图像(最好是特征鲜明、尺寸小一些)列表输入 Multiple_exists() 函数。该函数通过循环执行截图操作，每0.2秒进行一次，以最小化循环识别时间。接着将设备屏幕截图和目标图像传递给 match_in_predict_area() 函数，进行裁剪和搜索。一旦找到匹配的图像，立即将坐标信息反馈给 Multiple_exists() 函数，并最终将图像编号和位置信息返回至主函数，供进一步使用。

可以看到当日常在跑游戏ui回归或APP回归的时候可以利用起来，当一个元素有多种ui表现形式或着需要判断多个元素的情况时，我们可以参考lincoln同学提供的方式，修改成自己想要的效果。

下面是lincoln同学的方法函数源码，大家可以参考一下：


   
   
   
 
    
    
    def match_in_predict_area(template, screen=None, rect=None):  # 局部查找
    # logger = Gvar.logger
    if screen is None:
        if G.DEVICE is None:
            raise Exception("G.DEVICE is none.")
    screen = G.DEVICE.snapshot()  # 截屏
    if screen is None:
        raise Exception("snapshot is none.")
    if rect is None:
        return template.match_in(screen)  # 如果没有指定区域，在整个屏幕中查找
    if not isinstance(rect, (list, tuple)):
        raise Exception("to crop a image, rect should be a list")
    else:
        # logger.debug("找到目标%s"%template.filename)
        predict_screen = aircv.crop_image(screen, rect)  # 图片裁切，根据指定区域裁剪屏幕
        focus_pos = template.match_in(predict_screen)  # 在裁剪后的图片中查找模板
        if not focus_pos:
            return False  # 如果没有找到匹配，返回False
        else:
            return focus_pos[0]+rect[0], focus_pos[1]+rect[1]  # 返回匹配位置，加上裁剪区域的偏移
    # end if
# end def

def Multiple_exists(targets,area=None,threshold=0.80,rgb=False,inti=5):#多重查找
    
    # 根据设备方向确定宽度和高度
    if (G.DEVICE.display_info['orientation']%2):
        width = G.DEVICE.display_info['height']
        height = G.DEVICE.display_info['width']
    else:
        width = G.DEVICE.display_info['width']
        height = G.DEVICE.display_info['height']
    #end if
    
    # 尝试多次查找目标
    for i in range(inti):
        #Gvar.logger.debug('第%d次查找%s'%(i,targets))
        
        # 获取全屏截图
        fullScreen = G.DEVICE.snapshot()
        
        # 遍历每个目标
        for target in targets:
            #print("查找目标 %s"%target)
            if target :
                # 在预测区域内匹配目标，如果有元素固定出现的位置范围，可以传入，更进一步的减少识别时间
                focus_pos = match_in_predict_area(Template( '%d\%s.png'%(width, target),
                threshold=threshold, rgb=rgb),
                fullScreen, area)
            
            # 如果找到目标
            if focus_pos:
                #Gvar.logger.debug("找到目标 %s"%target)
                ref = targets.index(target)
                return ref,focus_pos
        #endif
    #end for
        
        # 每次查找间隔0.2秒
        sleep(0.2)
#end for
    
    # 如果所有尝试都失败，返回-1和(-1,-1)
    return -1,(-1,-1)
#end def Multiple_exists

三、实际使用案例

通过上述所讲的逻辑以及方式，我们这边给大家提供一个小小的使用案例，通过识别游戏画面内的三个元素是否都存在，从而去判断是否进入到我们需要的游戏画面。

参考代码如下：


   
   
   
 
    
    
    # -*- encoding=utf8 -*-
__author__ = "Airtest"

import os
from airtest.core.api import *
from airtest.aircv import *

auto_setup(__file__)

from poco.drivers.android.uiautomation import AndroidUiautomationPoco
poco = AndroidUiautomationPoco(use_airtest_input=True, screenshot_each_action=False)

def Multiple_exists(targets, area=None, threshold=0.80, rgb=False, inti=5):
    # 定义一个函数，用于检测多个目标是否存在
    # 参数说明：
    # targets: 目标列表
    # area: 搜索区域，默认为None（全屏）
    # threshold: 匹配阈值，默认为0.80
    # rgb: 是否使用RGB匹配，默认为False
    # inti: 尝试次数，默认为5次

    #新增找到的图片位置信息列表
    matches = []
    
    # 根据设备方向确定屏幕宽高
    if (G.DEVICE.display_info['orientation'] % 2):
        width = G.DEVICE.display_info['height']
        height = G.DEVICE.display_info['width']
    else:
        width = G.DEVICE.display_info['width']
        height = G.DEVICE.display_info['height']

    # 在指定的尝试次数内循环查找目标
    for i in range(inti):
        # 获取当前屏幕截图
        fullScreen = G.DEVICE.snapshot()
        # 遍历所有目标
        for target in targets:
            if target:
                # 构建目标图片的完整路径
                template_path = os.path.join(str(width), f"{target}.png")
                print(f"Trying to load template: {template_path}")
                # 在指定区域内查找目标
                focus_pos = match_in_predict_area(Template(template_path, threshold=threshold, rgb=rgb), fullScreen, area)
            #若找到图片则将当前图片出现的位置传入列表中
                if focus_pos:
                    matches.append((targets.index(target), focus_pos))
        # 如果所有目标都找到，立即返回结果
        if len(matches) == len(targets):
            return matches
               
        # 如果未找到所有目标，等待0.2秒后继续下一次尝试
        sleep(0.2)
    # 返回找到的所有匹配结果
    return matches       

def match_in_predict_area(template, screen=None, rect=None):  # 局部找图
    if screen is None:
        if G.DEVICE is None:
            raise Exception("G.DEVICE is none.")
    screen = G.DEVICE.snapshot()  # 获取设备屏幕截图
    if screen is None:
        raise Exception("snapshot is none.")
    if rect is None:
        return template.match_in(screen)  # 如果没有指定区域，在整个屏幕中查找
    if not isinstance(rect, (list, tuple)):
        raise Exception("to crop a image, rect should be a list")
    else:
        # logger.debug("找到目标%s"%template.filename)
        predict_screen = aircv.crop_image(screen, rect)  # 裁剪指定区域的图片
        focus_pos = template.match_in(predict_screen)  # 在裁剪后的图片中查找模板
        if not focus_pos:
            return False  # 如果没有找到匹配，返回False
        else:
            return focus_pos[0]+rect[0], focus_pos[1]+rect[1]  # 返回匹配位置，加上裁剪区域的偏移

if __name__ == "__main__":   
 #打开游戏，去确认是否游戏开始界面的元素已就位
    start_app("com.netease.dyll")
    sleep(1.0)
    poco(text="确定").click()
    touch([0.5,0.5])
    sleep(0.2)

    # 定义目标图片的路径列表
    targets = [r"D:/demo/pics.air/tpl1724135823600",r"D:/demo/pics.air/tpl1724135830426",r"D:/demo/pics.air/tpl1724135836266"]
    
    # 调用multiple_exists函数，查找游戏开始界面的图片识别情况
    result = Multiple_exists(targets)

#     打印查找结果
    for i in range(len(result)):
        print("图片{}的位置是：{}".format(i+1,result[i]))
        
    # 判断是否已进入游戏开始界面
    if len(result) == len(targets) :
        print("确认已进入到游戏的开始界面")

四、总结

本周推文我们分享了来自官方交流Q群2群的lincoln同学的一个快速遍历找图的方法函数，这里再次感谢lincoln同学的分享，在函数内我们主要的一个减少识别时间的思路是通过截图当前设备画面，并进行裁切判断，从而避免整个设备屏幕范围内寻找元素。

如果大家有更多好用好玩的Airtest使用脚本，也欢迎大家给我们投稿，同时如果大家在使用Airtest过程中有一些其他新的使用方式或者遇到了问题，又或者有任何想要深入了解的知识点，欢迎在官方交流群（526033840）里告诉我们或者提交issue。

（猜你还想看

）

▼

【私有云场景案例分享①】高效的集群管理能力

录屏方法剖析，记录脚本跑测不再难

Airtest封装的Tidevice接口有多好用（二）

本文分享自微信公众号 - AirtestProject（AirtestProject）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

osc_566335 2024-08-05 10:48

os是媾粉聚集地还不了解吗？只要碰到国产、华子相关报道，必然评论区乌烟瘴气口伏声难止。还能期待啥有深度发言？大佬敢发这些，那还给搞前端什么都懂的“程序员”粪死？

呼呼南风 2024-09-14 11:18

幸好我把自己电脑换成win10了。

songdragon 2024-08-14 13:11

这个对比的条件还存在好几个问题。 1. solon使用的是smart-http，spring使用的是undertow 2. solon启动本身的自动配置少于spring 这两点就决定了对比的维度不同，性能更好的原因大概率是web服务器、应用配置依赖导致的。如果要拉齐，需要使用同样的web服务器，spring应用排除掉所有的自动配置，只保留web必须的，才能说明框架的性能差距。现在这个结果，无法说明solon本身性能好。

blue_think 2024-08-26 11:00

别光喷华为啊，说点你自己的能力，到了什么程度，有什么成就，这样好歹有点说服力吧

279778325 2024-08-16 16:22

好不容易有个国产开发平台，没有鼓励只有贬低，就算宣传夸大怎么了？那么较真干什么？遍地都是夸大的广告宣传怎么不一个一个去找厂家？批判的同时想想自己能搞一个吗？为什么加上国产俩字就非要这么较真？

黑人牙膏 2024-07-21 12:12

真的人不要脸则无敌，只要他不尴尬，尴尬的是别人。

kakai 2024-09-07 10:39

微信咋得罪你了？不管怎么样，微信此举哪怕从自身商业利益出发，让苹果降低中国税率这是利于中国人的，这个税率可不仅仅是针对微信的，还苹果大功一件，这是多么愚蠢、可耻的言论！

大后锋 2024-07-10 14:03

然后交警找责任方，打过去是牛逼高大上的生成式AI的客服

优秀良民 2024-07-10 16:17

明明能躺平，明明可以割韭菜，还花钱研发？为了找骂？说这个能割韭菜？你被割了？你买了吗？是谁年年换mac，是谁年年换iphone？华为的用户好像没有那么干的吧？真让我一个小米用户都看不下去了！

来开源啊 2024-09-14 15:07

25× 23.1 √

0day 2024-07-21 11:52

一个流氓也配谈安全？

平波 2024-07-07 16:54

吃完就砸锅，好像那个啥纯血，吃完了，就想把小米，oppo、vivo的锅咂了；😂

奶奶灰 2024-09-15 20:28

换kvm 了

Kevin586 2024-07-29 17:09

真降低成本还是得换go，java太吃内存了

liming0101 2024-09-10 09:09

什么纳吉东西，还碰瓷黑神话

Azeroth008 2024-07-09 10:43

有自研操作系统挺好的啊，那些乱喷的人是什么心态？

封神梦 2024-09-14 17:53

反正wps就是各种vip广告，挺恶心人的

深夜49 2024-09-14 14:36

免费版只能用30分钟，太坑了吧。

osc_566335 2024-08-01 15:05

“虽然两人只有大专学历”—— 大专也算高等教育，现在这些媒体口中已经文盲一个级别的感觉了吗？

zb79463626 2024-08-26 15:51

IBM中国哪有什么研发? 全部都是测试！所谓的搞研发的都是去养老混日子的！

加百列Gabriel 2024-09-14 13:50

各位不要急着更新, 更新完之后linux虚拟机不支持3D加速了

简洛-默 2024-08-12 19:31

你是家里才通网吗? 龙芯早都弃用MIPS了，现在是自研的LoongArch。自己好好看看吧：https://loongarch.dev/zh-cn/posts/20210501-loongarch-manual/

我有我可以 2024-07-09 11:40

喷子们之所以喷，其本质是为自己的阴暗和自卑找理由罢了。

烈冰 2024-07-22 08:41

不如说国内90%的电脑都没安装CrowdStrike软件

天

天1天1天 2024-09-14 16:56

文章写的也没错，至于是不是steam的功劳，也无所谓，反正能玩了。

Yanlongli 2024-07-11 17:28

降低了视觉复杂性，增高了操作复杂性。

平波 2024-09-14 15:57

我倒是觉得好用，像真人就行；我可不希望它是真正的智慧生物；深度这些东东，本质就是曲面建模和贝叶斯/马尔科夫链这种概率建模；只要知识量够大，算力够强，机器就越像人；它有没有意识，并不重要；因为人的意思，估计也是伪命题；

我要探索宇宙 2024-09-16 14:43

3.5.2版本，队列redis能用集群模式的redis吗？

浪_客 2024-09-15 12:54

继续用vm吧，ensp不让用新版vbox😂

字节跳动开源 2024-09-14 16:05

可以的，可以看看发布的一些用户案例

HalLi 2024-09-09 01:10

普通用户不懂就算了，怎么连程序员都不懂？苹果是全平台30%，国产是渠道服50%。微信、抖音这种大app哪来的渠道服，除了游戏，哪个app带渠道服。

开源博客 2024-09-14 22:13

Virtualbox新管网使用vw布局单位，高分屏上使用浏览器的缩放没效果，字体仍老大==

平波 2024-09-14 19:01

你了做过为为的项目啊；😂

longzz 2024-09-14 11:04

🤣65岁还在写代码吗？

yh2216 2024-09-14 10:26

猜测：c++部分应该是切换了鸿蒙的系统api，UI则仅仅是使用鸿蒙的UI框架而已。

平波 2024-09-14 15:46

你真是行家里手啊，😂；这个本质是数学建模，就像初中数学中的板据两点确定一条直线，然后可以根据任意x,预测y值啊，其实就这么简单啊

开源中国首席路人王 2024-09-15 15:47

ipv6 tomcat需要改什么支持吗

Artrener 2024-07-21 15:12

可以看他不爽，看360不爽，但人家说的是事实。比如说航空业的业内人士也这么说的。

阳光满地 2024-09-15 00:25

加个证书那么简单的事，为什么还要等下一步再优化呢？

infoworld 2024-09-11 18:00

感谢，正是有你们这些先驱做的实事，才能避免被国外的系统和应用垄断。

RustDesk 2024-09-16 11:20

惨淡

zb79463626 2024-09-15 12:07

纯血鸿蒙不再是用android改的了，DevEco什么时候也纯血脱离Eclipse啊？😄

osc_50722289 2024-09-06 13:51

如果苹果不让步，微信也不让步那就好看了！微信在中国深入寻常百姓家！支付社交微信根本离不开，如果微信不在IOS上更新，苹果“不用混了”

yh2216 2024-09-14 10:24

wps确实做的很棒，比微软的office好用，比libreoffice好用很多。wps加油，鸿蒙做的不错，继续加油，支持生态建设。

CloudShi83 2024-07-06 17:13

感谢祖师爷赏饭吃，给你磕一个

fasiondog 2024-09-14 17:26

👍

fastfail 2024-09-15 08:37

捞钱捞到手抽筋

智布道 2024-08-13 12:02

不管是谁在打平安县城，我三五八团一定帮帮场子！

叨

叨叨颠颠 2024-09-14 16:17

代码这东西就和女人穿不同衣服一样，包装不同，就可以换个人样儿，其实里面还是。字符串替换--变量名改改、方法名改改、文件名改改，方法return的改为void，值参改形参，一个类改几个拼接，一个结构体改几个组合，一个方法改几代继承。哪个敢说这是抄，百分之百纯自研，原生态。

Kevin586 2024-09-14 16:00

vagrant什么时候支持7.1我才更

Tobyee 2024-07-09 11:04

没GMS是借口，本质还是不想适配国内的手机系统，等鸿蒙Next出来，看微软拥抱不拥抱就知道了

Binx 2024-09-07 08:28

最好提高苹果税到80%，不然怎么彰显尊贵的苹果用户身份

Ask_x_Seek 2024-09-14 15:19

支持

kushu001 2024-08-14 15:24

为什么一定要强调“国产”？是开源的项目么？如果开源，是不是不接受国外开发者的贡献？我只是好奇，不带“国产”，是宣传不了了么😀

高排量低炭烧 2024-09-14 23:34

牛逼🤬

无尽的拉格朗日 2024-09-14 12:56

底层代码大部分估计都能共用反正都是c/c++，上层界面层重写吧

vb2005xu 2024-09-14 10:17

这数据有1%真吗

dwingo 2024-07-18 10:12

不是不让用jni和unsafe啊, 只是做了"限制", 只要加命令行参数就能继续用, 目的是为了让使用者考量程序的安全性.

fzn0268 2024-09-04 14:26

这是那个做代码生成器的老哥起的吧

Francesca 2024-09-15 17:30

会不会是你用的版本比较老，新版本应该没问题

批量图像识别的快速遍历技巧

一、前言

二、方法详解

三、实际使用案例

四、总结

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号

批量图像识别的快速遍历技巧

一、前言

二、方法详解

三、实际使用案例

四、总结

热门内容

全站热门评论

关于作者

作者的专辑

作者的其它热门文章

热门资讯

推荐关注

热门软件

OSCHINA 社区

在线工具

攻略

QQ群

公众号

视频号