jQuery Sizzle选择器(一)

1、浏览器对css选择器采取逆向(从右向左)解析的原因:

  如果正向解析,例如「div div p em」,我们首先就要检查当前元素到 html 的整条路径,找到最上层的div,再往下找,如果遇到不匹配就必须回到最上层那个 div,往下再去匹配选择器中的第一个 div,回溯若干次才能确定匹配与否,效率很低。

  逆向匹配则不同,如果当前的 DOM 元素是 div,而不是 selector 最后的 em,那只要一步就能排除。只有在匹配时,才会不断向上找父节点进行验证。找到所有的em之后,再通过查找他的父元素是不是p来进行过滤。

2、Sizzle如果分解用户传入的css选择器字符串

以”div > div.cl p span.red“为例

  在Sizzle内部封装了一个方法,该方法负责将css选择器分解为一个数组。数组中的每一项是一个对象,格式如下:

    {

      "type" : "CLASS",

      "value" : ".red",
      "matchs" : " "

    }

  看一下tokenize的源码:

  // 假设传入进来的选择器是:div > p + .cl[type="checkbox"], #id:first-child
  // 这里可以分为两个规则:div > p + .aaron[type="checkbox"] 以及 #id:first-child
  // 返回的需要是一个Token序列
  // Sizzle的Token格式如下 :{value:'匹配到的字符串', type:'对应的Token类型', matches:'正则匹配到的一个结构'}
  function tokenize( selector, parseOnly ) {
    var matched, match, tokens, type,
    soFar, groups, preFilters,
    cached = tokenCache[ selector + " " ];
    // 这里的soFar是表示目前还未分析的字符串剩余部分
    // groups表示目前已经匹配到的规则组,在这个例子里边,groups的长度最后是2,存放的是每个规则对应的Token序列

    // 如果cache里边有,直接拿出来即可
    if ( cached ) {
      return parseOnly ? 0 : cached.slice( 0 );
    }

    // 初始化
    soFar = selector;

    // 这是最后要返回的结果,一个二维数组

    // 有多少个并联选择器,里面就有多少个数组,数组里面是拥有value与type的对象
    groups = []; 

    // 这里的预处理器为了对匹配到的Token适当做一些调整
    // 自行查看源码,其实就是正则匹配到的内容的一个预处理
    preFilters = Expr.preFilter;

    // 递归检测字符串
    // 比如"div > p + .cl input[type="checkbox"]"
    while ( soFar ) {

      //  以第一个逗号切割选择符,然后去掉前面的部分,处理同时传入多个同级选择器的情况,例如:$( "div, span" )
      if ( !matched || (match = rcomma.exec( soFar )) ) {
        if ( match ) {
          // 如果匹配到逗号,将soFar中匹配到的部分删除掉
          soFar = soFar.slice( match[0].length ) || soFar;
        }
        // 往规则组里边压入一个Token序列,目前Token序列还是空的
        groups.push( tokens = [] );
      }

      // 将matched重置为false,为下次判断soFar中是否有内容做准备

      matched = false;

      // 将刚才前面的部分以关系选择器再进行划分
      // 先处理这几个特殊的Token : >, +, 空格, ~
      // 因为他们比较简单,并且是单字符的
      if ( (match = rcombinators.exec( soFar )) ) {
        // 获取到匹配的字符
        matched = match.shift();
        // 放入Token序列中
        tokens.push({
          value: matched,
          type: match[0].replace( rtrim, " " )
        });
        // 剩余还未分析的字符串需要减去这段已经分析过的
        soFar = soFar.slice( matched.length );
      }

      // 这里开始分析这几种Token : TAG, ID, CLASS, ATTR, CHILD, PSEUDO, NAME
      // 将每个选择器组依次用ID,TAG,CLASS,ATTR,CHILD,PSEUDO这些正则进行匹配
      // Expr.filter里边对应地 就有这些key
      //如果通过正则匹配到了Token格式:match = matchExpr[ type ].exec( soFar )
      //然后看看需不需要预处理:!preFilters[ type ]
      //如果需要 ,那么通过预处理器将匹配到的处理一下 : match = preFilters[ type ]( match )

      for ( type in Expr.filter ) {

        if ( (match = matchExpr[ type ].exec( soFar )) && (!preFilters[ type ] ||
          (match = preFilters[ type ]( match ))) ) {
          matched = match.shift();
          //放入Token序列中
          tokens.push({
            value: matched,
            type: type,
            matches: match
        });
        //剩余还未分析的字符串需要减去这段已经分析过的
        soFar = soFar.slice( matched.length );
      }
    }

    //如果到了这里都还没matched到,那么说明这个选择器在这里有错误
    //直接中断词法分析过程
    //这就是Sizzle对词法分析的异常处理
    if ( !matched ) {
      break;
    }
  }
  //放到tokenCache函数里进行缓存
  //如果只需要这个接口检查选择器的合法性,直接就返回soFar的剩余长度,倘若是大于零,说明选择器不合法
  //其余情况,如果soFar长度大于零,抛出异常;否则把groups记录在cache里边并返回,
  return parseOnly ?
    soFar.length :
    soFar ?
    Sizzle.error( selector ) :
    tokenCache( selector, groups ).slice( 0 );
}

原文地址:https://www.cnblogs.com/charling/p/3501118.html