神奇的match和replace

源自跟奈落大叔的讨论，PHP和JavaScript的比较。

正则：

先说几个正则写法：

() 选择匹配一组， (?:) 降低 () 的优先级， .*? 和 .+? ，阻止 . 和 + 的贪婪。

还有一些正则的高级写法：

(?=) 和 (?<=) ，零宽断言，以及 (?!) 和 (?<!) ，负向零宽，详见：百度百科（正则表达式）。

以及js里正则常用的方法：

reg.test(str) 检测reg是否匹配str中的内容，返回true或false。

match：

先来一个例子：

var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22";
var a=url.match(/t/);       // ["t"]                    // 找一个
console.log(a.index);       // 1                        // 找一个,带着它所在的位置(index)
url.match(/t/g);            // ["t", "t", "t", "t"]     // 找一堆,不带index
url.match(/(t)/);           // ["t", "t"]               // 带括号找一个,第一个是结果,第二个是括号里匹配到的内容
url.match(/(t)/i);          // ["t", "t"]               // 带括号加i,跟没加一样,没有特殊
url.match(/(t)/g);          // ["t", "t", "t", "t"]     // 带括号加g,只有结果
url.match(/(?:t)/);         // ["t"]                    // 使用?:取消()的优先级,有index属性
url.match(/(?:t)/g);        // ["t", "t", "t", "t"]     // 加上g后依然返回一堆

上面几个，带上g标记，会得到所有匹配的内容，不带g则只会匹配到第一个结果（也是数组），而且这个数组多了index属性，表示匹配内容所在的位置。

而i标记不会影响结果个数，每出现一个 () 都会在匹配结果中增加一项，而改为 (?:) 后则不会增加。即使增加了，也是只匹配出一个结果，数组依然有index属性。

鼓捣了一下午，弄了个高端且粗糙的：

var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22";
url.match(/(.*?):/{2}(.*?)/([^?#]*(?=/[^/]*)[/$])([^?#]*)([?#].*)?/);
// ["http://www.cnblogs.com/rubylouvre/p/3181291.html#top22", "http", "www.cnblogs.com", "rubylouvre/p/", "3181291.html", "#top22"]

返回结果：[整个地址，协议名称，域名，文件路径，文件名，hash/search]。

写法有很多，这里只是想用一下 (?=) 方式，以我现在的水平，只要结果对就好。。

replace：

以前用replace，主要是像 str.replace(reg/str,str/function(s){return fn(s)}); 这样，现在要加上正则的用法：反向引用。

先来一个例子：

var str="abcdefg";
str.replace(/([abc])/g,"$&,");                // "a,b,c,defg"
str.replace(/([abc])([bcd])/g,"$&,");         // "ab,cd,efg"
str.replace(/([abc])([bcd])/g,"$1,$2;");      // "a,b;c,d;efg"

可以在后面的替换字符串里，用 $& 表示匹配出的结果，相当于match结果的第[0]个（其实PHP中就是用 &0 来表示的），用 &n 来表示第n个小括号里匹配出的内容，相当于match结果中的第[n]个。

出了这两个，还有 &` 表示匹配结果左侧的内容， &' 表示匹配结果右侧的内容， $$ 表示替换成一个$符。

收获：

正则里，还有js对正则的使用，都有很多东西值得挖掘。