利用图像识别技术解决非原生控件的定位问题

缘起

前天同桌妹纸问一个控件怎么定位的问题，我张口就来，ID，xpath。。。。。妹纸说这些我都试过了，还是无法定位,不信我Debug给你看。N种方法尝试后，只能接受现实，非原生控件，于是老脸一红，告诉妹纸，这是非原生控件，无法通过常规方式定位。搜索了一下，很多帖子都反映过这个问题，但是都没给出解决策略。不知道这些小伙伴最终有没有解决。遂决定，吃个大闸蟹，研究一下看能否解决。

非原生控件给自动化带来的痛点

View里控件都定位不到
控件随机变化（如支付密码键）
密码键盘每次页面打开或者页面刷新键位都不一样
常规定位方式无法识别
智能货架，经常变换的显示位置

常规解决方式

坐标大法：但是坐标大法对于有些随机变化密码键就无法操作了。
开发配合：给特定的app包，解除安全键盘。这种操作无异于饮鸩止渴。

图像识别尝试

由于我们页面控件不会像验证码那么多干扰难识别，现在图形识别技术Java，Python，C++等都非常成熟。一通百度后在OpenCV 发现了matchTemplate 方法，在图片中找指定的图片。主要用的以下两种方法：

使用OpenCV函数 matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像
使用OpenCV函数 minMaxLoc 在给定的矩阵中寻找最大和最小值(包括它们的位置).

具体实现

截取图
1. 滑动到非原生控件，使元素可见
2. 截取截目画面即为原图像
3. 用画图工具打开原图像（不要人为放大或者缩小原图像），截取非原生控件的图像即为模板图像
4. 原图像：
5. 如下用画图工具打开，保证分别率不变下截取目标图像作为模板图像
6. 模板图像（非原生控件图像）
取坐标
1. 执行OpenCV函数 matchTemplate获取坐标
2. 为方便公司同事和社区伸手党使用，直接上码 LvmamaKit代码工程Git传送门，调用LvmamaKit.find2BElementPoint4Debug会在原图像上标识出是否匹配成功
3. 第二步成功后，调用LvmamaKit.find2BElementPoint返回Json格式坐标
4. 回显示意图，忽略图片失真
  
  5.返回坐标，自行计算出中心坐标 {"x":"309","y":"854","width":"105","height":"82"}
点坐标
1. 拷贝返回的坐标，进行相对计算
2. 点击相对坐标，完成你的自动化用例
识别密码
1.密码键盘，1-9随机变，图像识别妥妥的搞定。示意图
搞定收工
1. 明天可以给妹子解决非原生控件的定位问题咯

参考资料

代码拷来总觉浅，绝知此事要躬行