java写投票脚本自动化初探

由于大学里面有一些任务需要投票，而又不想劳烦他人去帮我，所以打算自己写一个脚本来实现自动投票的功能。这里记录一下我的整个过程。

技术选型

java8
selenium3 实现chrome自动化的jar包
AUTolt 模拟键盘操作的软件

导入selenium3

这里我用的maven导入的，代码如下：

      <dependency>
           <groupId>org.seleniumhq.selenium</groupId>
           <artifactId>selenium-server</artifactId>
           <version>3.141.59</version>
       </dependency>
       <dependency>
       <groupId>org.seleniumhq.selenium</groupId>
       <artifactId>selenium-java</artifactId>
       <version>3.14.0</version>
   </dependency>

代码结构

利用代码启动chrome

由于我这里是用的chrome实现的自动化，所以我们先要下chrome的启动器

我们需要下载对应版本的启动器，不然会失效，首先查看自己的chrome版本，然后打开每个版本的文件夹，里面有notes.txt,显示对应的支持版本范围。

下载好之后随便放到一个位置，后面根据路径引入即可，为了方便我将程序放到我的resource目录下了，如上图所示，代码如下：

        // 设置webdirver路径  这个BrushTicket是指的这个代码所在的类。
        System.setProperty("webdriver.chrome.driver", BrushTicket.class.getClassLoader().getResource("chromedriver.exe").getPath());


// 创建ChromeOptions，options可以设置一些网页请求头啥的
        ChromeOptions options = new ChromeOptions();

        //        指定本机chrome安装位置
        options.setBinary("C:\Program Files (x86)\Google\Chrome\Application\chrome.exe");

          // 创建WebDriver对象
         ChromeDriver driver = new ChromeDriver(options);

         // 打开那个网站
         driver.get("https://www.wjx.cn/m/36384473.aspx");

要记住，这个driver是最核心的类，我们后面根据这个driver在网页上做各种操作

网页自动点击操作

这个做法很简单，基本就是定位需要点击的位置，然后点击。

我截取了一小段代码，基本上所有点击的功能就都会了


 driver.findElement(By.xpath("//div[@id='divSubmit']/div[2]")).click();

嗯哼，这里其实就需要注意一下这个xpath的定位问题，//div[@id='xxx'],就是定位这个id为啥的元素，其实也可以用通配符，比如说 //* [@id='xxx']。后面再像洋葱一样，一层层的扒网页就行。

这个findElement的返回值是WebElement,这个元素又可以做各种操作，比如取css的属性，或者自己的属性，也可以点击和输入值(sendKeys)

验证码(未完全解决)

本来以为点完各种按钮，提交之后就完事，结果不！突然出现了验证码。

挣扎了很久，我选择了将验证码下载到本地后，然后解析出验证码这个解决办法。

解决弹窗问题

我们没有管验证码直接提交，会弹出一个警告框，我们先解决弹窗，后来发现问卷星的网页结构是，弹窗由一个div构成的，如果没有弹过的时候是没有这个结构的，第二次弹出之前，会将之前的div由display:none属性改回block属性，这样就简单了。具体代码如下：

/**
    * 功能描述: //判断是否由弹出框
    * @Param: [driver]
    * @Return: boolean
    * @Author: WHOAMI
    * @Date: 2019/6/8 22:21
     */
private boolean ifAlert(ChromeDriver driver){
       try
       {
         //定位元素，如果没有这个元素直接报错
           WebElement  webElement = driver.findElement(By.xpath("//div[@id='alert_box']"));

           Thread.sleep(300);

           if(!webElement.getCssValue("display").equals("none")) {
               return true;
           }
       }
       catch (Exception Ex)
       {
           Ex.printStackTrace();
           return false;
       }
       return false;
   }

根据有没有Alert框判断是不是让我们输入验证码。

下载图片

首先我们需要利用Action解决右键另存图片这个操作

具体代码如下：


  // 这个driver是ChromeDriver
      Actions action = new Actions(driver);

// 定位到验证码图片的位置
      WebElement element = driver.findElement(By.xpath("//div[@id='tdCode']/table/tbody/tr/td[3]/img"));

// action移动到指定位置
      action.moveToElement(element);
// 休眠等待网页反应
      Thread.sleep(200);

// 这里模拟右键 打开菜单
      action.contextClick(element).build().perform();


      //模拟键盘操作（这里是移动向下方向键）  这个Robot是java.awt包下面的
      Robot robot = new Robot();
      Thread.sleep(400);
      // 模拟键盘下方向键
      robot.keyPress(KeyEvent.VK_DOWN);

      Thread.sleep(400);
      robot.keyPress(KeyEvent.VK_DOWN);
// 模拟回车键
      Thread.sleep(400);
      robot.keyPress(KeyEvent.VK_ENTER);

后面需要了解一下java.awt这个包

由于后面的选择保存位置然后下载操作是selenium3实现不了的，所以我们选择了AUTolt这个软件，下载网址
,然后安装即可，这里不再赘述。

软件安装好之后，是这个样子的

操作AUTolt定位窗口

先打开游览器准备上面另存为的操作

定位另存为窗口需要这个数据 Class: 比如上面的窗口时#32770，下面写脚本需要用。

定位按钮啊，编辑框啥的需要这个数据 CLassNameNN

其实我这里为了方便保存图片都是一个名字，而且为了方便都没有删除图片，所以这里出现了一个替换的问题，解决办法其实就是在定位一下替换的窗口和确定按钮就行

写脚本

打开写脚本的工具，我的代码是这样的，改改就能用

ControlFocus("另存为", "","Edit1")
;ControlFocus("title","text",controlID) Edit1=Edit instance 1
; Wait 10 seconds for the Upload window to appear

WinWait("[CLASS:#32770]","",10)

; Set input focus to the edit control of Upload window using the handle returned by WinWait

  ControlFocus("另存为","","Edit1")

  Sleep(1000)

; Set the File name text on the Edit field

  ControlSetText("另存为", "", "Edit1", "buff.gif")

  Sleep(200)

; Click on the Open button

ControlClick("另存为", "","Button2");

ControlFocus("确认另存为", "","Edit2")

 WinWait("[CLASS:#32770]","",10)

 sleep(200)


ControlClick("确认", "","Button1");

写完脚本后，保存成au3格式的文件，准备合成exe

合成exe文件

打开合成exe程序,确定脚本和生成exe路径即可。

java引用该文件

//调用你使用Compile Script to.exe生成的可执行exe文件 这个download.exe就是我生成的exe文件
           //对Windows窗体进行操作：更换文件名，并保存到指定文件夹
     Runtime.getRuntime().exec("D:\code\java\download.exe");
//代码等待程序完成在进行接下来的操作。
     Thread.sleep(4000);

验证码去除干扰线

由于我没有学openCV算法，所以我就直接粘代码了。

/**
   * 功能描述: //验证码去除干扰线
   * @Param: [sfile：图片文件路径, destDir：文件名字]
   * @Return: void
   * @Author: WHOAMI
   * @Date: 2019/6/8 22:11
    */
   public static void cleanLinesInImage(File sfile, String destDir)  throws IOException {
       File destF = new File(destDir);
       if (!destF.exists())
       {
           destF.mkdirs();
       }

       BufferedImage bufferedImage = ImageIO.read(sfile);
       int h = bufferedImage.getHeight();
       int w = bufferedImage.getWidth();

       // 灰度化
       int[][] gray = new int[w][h];
       for (int x = 0; x < w; x++)
       {
           for (int y = 0; y < h; y++)
           {
               int argb = bufferedImage.getRGB(x, y);
               // 图像加亮（调整亮度识别率非常高）
               int r = (int) (((argb >> 16) & 0xFF) * 1.1 + 30);
               int g = (int) (((argb >> 8) & 0xFF) * 1.1 + 30);
               int b = (int) (((argb >> 0) & 0xFF) * 1.1 + 30);
               if (r >= 255)
               {
                   r = 255;
               }
               if (g >= 255)
               {
                   g = 255;
               }
               if (b >= 255)
               {
                   b = 255;
               }
               gray[x][y] = (int) Math
                       .pow((Math.pow(r, 2.2) * 0.2973 + Math.pow(g, 2.2)
                               * 0.6274 + Math.pow(b, 2.2) * 0.0753), 1 / 2.2);
           }
       }

       // 二值化
       int threshold = ostu(gray, w, h);
       BufferedImage binaryBufferedImage = new BufferedImage(w, h, BufferedImage.TYPE_BYTE_BINARY);
       for (int x = 0; x < w; x++)
       {
           for (int y = 0; y < h; y++)
           {
               if (gray[x][y] > threshold)
               {
                   gray[x][y] |= 0x00FFFF;
               } else
               {
                   gray[x][y] &= 0xFF0000;
               }
               binaryBufferedImage.setRGB(x, y, gray[x][y]);
           }
       }

       //去除干扰线条
       for(int y = 1; y < h-1; y++){
           for(int x = 1; x < w-1; x++){
               boolean flag = false ;
               if(isBlack(binaryBufferedImage.getRGB(x, y))){
                   //左右均为空时，去掉此点
                   if(isWhite(binaryBufferedImage.getRGB(x-1, y)) && isWhite(binaryBufferedImage.getRGB(x+1, y))){
                       flag = true;
                   }
                   //上下均为空时，去掉此点
                   if(isWhite(binaryBufferedImage.getRGB(x, y+1)) && isWhite(binaryBufferedImage.getRGB(x, y-1))){
                       flag = true;
                   }
                   //斜上下为空时，去掉此点
                   if(isWhite(binaryBufferedImage.getRGB(x-1, y+1)) && isWhite(binaryBufferedImage.getRGB(x+1, y-1))){
                       flag = true;
                   }
                   if(isWhite(binaryBufferedImage.getRGB(x+1, y+1)) && isWhite(binaryBufferedImage.getRGB(x-1, y-1))){
                       flag = true;
                   }
                   if(flag){
                       binaryBufferedImage.setRGB(x,y,-1);
                   }
               }
           }
       }


       // 矩阵打印
       for (int y = 0; y < h; y++)
       {
           for (int x = 0; x < w; x++)
           {
               if (isBlack(binaryBufferedImage.getRGB(x, y)))
               {
                   System.out.print("*");
               } else
               {
                   System.out.print(" ");
               }
           }
           System.out.println();
       }

       ImageIO.write(binaryBufferedImage, "jpg", new File(destDir, sfile
               .getName()));
   }

   public static boolean isBlack(int colorInt)
   {
       Color color = new Color(colorInt);
       if (color.getRed() + color.getGreen() + color.getBlue() <= 300)
       {
           return true;
       }
       return false;
   }

   public static boolean isWhite(int colorInt)
   {
       Color color = new Color(colorInt);
       if (color.getRed() + color.getGreen() + color.getBlue() > 300)
       {
           return true;
       }
       return false;
   }

   public static int isBlackOrWhite(int colorInt)
   {
       if (getColorBright(colorInt) < 30 || getColorBright(colorInt) > 730)
       {
           return 1;
       }
       return 0;
   }

   public static int getColorBright(int colorInt)
   {
       Color color = new Color(colorInt);
       return color.getRed() + color.getGreen() + color.getBlue();
   }

   public static int ostu(int[][] gray, int w, int h)
   {
       int[] histData = new int[w * h];
       // Calculate histogram
       for (int x = 0; x < w; x++)
       {
           for (int y = 0; y < h; y++)
           {
               int red = 0xFF & gray[x][y];
               histData[red]++;
           }
       }

       // Total number of pixels
       int total = w * h;

       float sum = 0;
       for (int t = 0; t < 256; t++)
           sum += t * histData[t];

       float sumB = 0;
       int wB = 0;
       int wF = 0;

       float varMax = 0;
       int threshold = 0;

       for (int t = 0; t < 256; t++)
       {
           wB += histData[t]; // Weight Background
           if (wB == 0)
               continue;

           wF = total - wB; // Weight Foreground
           if (wF == 0)
               break;

           sumB += (float) (t * histData[t]);

           float mB = sumB / wB; // Mean Background
           float mF = (sum - sumB) / wF; // Mean Foreground

           // Calculate Between Class Variance
           float varBetween = (float) wB * (float) wF * (mB - mF) * (mB - mF);

           // Check if new maximum found
           if (varBetween > varMax)
           {
               varMax = varBetween;
               threshold = t;
           }
       }

       return threshold;
   }

粘贴完代码后运行就会在相同的路径下覆盖原来的验证码图片，但是据我测试，这个代码效果不是很理想，所以才是未完成的操作。

图像识别

图片识别我打算利用tess4j。

maven导入项目

        <dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>4.3.1</version>
        </dependency>

导入语言包，这一步操作需要我们下载tess4j的源代码，然后解压之后将tessdata移出来，供下面导入。

接着我们利用tess4j进行图像识别

我发现根据上面图像处理之后，图像放大10倍后tess4j的识别率是最高的，所以有了下面的代码


  /**
  * 功能描述: //将代码放大10倍
  * @Param: [file]
  * @Return: java.awt.image.BufferedImage
  * @Author: WHOAMI
  * @Date: 2019/6/8 22:24
   */
    private static BufferedImage change(File file){

        // 读取图片字节数组
        BufferedImage textImage = null;
        try{
            InputStream in = new FileInputStream(file);
            BufferedImage image = ImageIO.read(in);
            in.close();
            textImage = ImageHelper.convertImageToGrayscale(ImageHelper.getSubImage(image, 0, 0, image.getWidth(), image.getHeight()));  //对图片进行处理
            textImage = ImageHelper.getScaledInstance(image, image.getWidth() * 10, image.getHeight() * 10);  //将图片扩大5倍

        }catch (IOException e) {
            e.printStackTrace();
        }

        return textImage;
    }

接着就是我们的核心代码了

public static String deal(String pathname,String fileName){
        //打开需要处理的图片
        File imageFile = new File(pathname+"\"+fileName);

        try {
          //去干扰线
            cleanLinesInImage(imageFile,pathname);
        } catch (IOException e) {
            e.printStackTrace();
        }


        //开始图像识别
        Tesseract instance = new Tesseract();



          // 这是我的语言包的路径
        instance.setDatapath("D:\code\java\ChromeOperation\tessdata");

        instance.setLanguage("eng");//选择字库文件（只需要文件名，不需要后缀名）
        //将验证码图片的内容识别为字符串
        try {
          // 打开处理后的图像
            File image = new File(pathname+"\"+fileName);

            String result = instance.doOCR(change(image));


          //利用正则表达式过滤掉非法字符
            String correct = result.replaceAll("[^0-9a-zA-Z]J*","");
            // 返回正确的字符串
            return correct;
        } catch (TesseractException e) {
            e.printStackTrace();
        }

        return null;
    }

重复验证

由于上面的代码并不理想，所以我打算利用死循环直到他输入正确为止，代码如下：

          while(ifAlert(driver)){

               driver.findElement(By.xpath("//div[@id='alert_box']/div[2]/div[2]/div[2]")).click();
               dealImg(driver);
           }