javascript另类方法高效实现htmlencode()与htmldecode()函数

最常见的做法是采用正则表达式替换的方法,将特殊字符如 < > & 等进行替换,htmlencode的时候这样替换还比较容易,但发过来htmldecode的时候就不一定好用了,因为需要反转的情况很多,出了常见的&lt;&gt;&amp;以外,还有&nbsp;&copy;&quot;&reg;等数十个字符实体,还有&#65;&#66;&#20013;&#25991;或者&#x4E2D;&#x6587;之类以字符的Unicode编码的十进制或16进制表示的转义,难以全部列举,用逐个替换不仅代码冗长而且低效,还容易漏掉某些字符。

代码如下:

[javascript] view plain copy
 
  1. function htmlencode(s){  
  2.     var div = document.createElement('div');  
  3.     div.appendChild(document.createTextNode(s));  
  4.     return div.innerHTML;  
  5. }  
  6. function htmldecode(s){  
  7.     var div = document.createElement('div');  
  8.     div.innerHTML = s;  
  9.     return div.innerText || div.textContent;  
  10. }  

相当简洁!

编码原理就是创建TextNode节点,附加到容器中,再取容器的innerHTML.

解码原理是将字符串赋給容器的innerHTML,再取innerText或textContent.

测试一下:

[javascript] view plain copy
 
  1. //测试  
  2. document.onclick = function (){  
  3.     //&lt;p&gt; &amp; &lt;/p&gt;  
  4.     alert(htmlencode('<p> & </p>'));  
  5.   
  6.     //<p> & © ABC 中文 中文 </p>  
  7.     alert(htmldecode('&lt;p&gt; &amp; &copy; &#65;&#66;&#67; &#20013;&#25991; &#x4E2D;&#x6587; &lt;/p&gt;'));  
  8. }  

效果不错。 

htmldecode对入参有要求,如果入参不是合法的encode后的结果,可能无法得到预期结果。

我在google搜索,在cnblogs找到一篇和我一样思路的,原来已经有别人这样想了=||=,不过他的htmldecode代码有错误。

原文地址:https://www.cnblogs.com/waw/p/8452764.html