编码与解码

在web开发中，经常遇到编码与解码的问题，有的用于Hmtl的编码与解码，有的用于url的编码与解码。咋ibutong的场景下，一些符号不能直接使用，这个时候就需要对其进行编码与解码的操作了。

HTML编码与解码

Html是一种标记语言，其中<>符号有着特殊的意义，当我们想在页面上展示包含这些符号的时候，就会造成浏览器错误的处理。

例如，一些有关于开发的网站，希望在页面上展示标签的内容，如：<h1>2016年，某年某月</h1>，但，html中，标记<h1>表示1号标题，就会在页面中使用1号标题，造成不是我们想要的展示结果。HtmlEncode方法用于对文本中的<,>进行编码，以避免与html中的标记冲突，导致文本内容被浏览器解释为网页标记。

解码的过程比较简单，一般是由浏览器来完成，浏览器会分析编码后的文本，然后进行html的解码，以正确的显示网页的内容。当然，如果需要，也可以通过HtmlDecode方法对编码后的html进行解码。

        protected void Page_Load(object sender, EventArgs e)
        {
            string html = "<h1>面朝大海，春暖花开</h1>";
            string htmlEncode = Server.HtmlEncode(html);
            Response.Write(htmlEncode);
        }

输出

f12查看，生成的html

URL编码与解码

在开发工作中，经常遇到url中有汉字的情况，但url又与html不同，它不是标记语言，但需注意的是，在url中只应该出现ASCII字符。对于url中出现的ASCII之外的字符，必需对其进行转换了，URL编码的目的就是对其进行有效的格式转换，转换为ASCII编码。UrlEncode方法用来对Url字符串进行编码，以避免url中的信息被错误的解读。

UrlEncode首先使用呼应中过的编码对内容进行编码，编码后的字节数组再看成是ASCII字符，其中A~Z,a~z,0-9,-,_,.,!,*,\,(,)被认为是安全的字符，不需要特特殊编码。其他字符要经过字符编码，空格编码为+，剩下的被编码为%引导的十六进制表示方法。

        protected void Page_Load(object sender, EventArgs e)
        {
            string url = "http://hello world.com/test.aspx?name=张三";
            Response.Write(Server.UrlEncode(url));
        }

输出

与html的解码类似，url的解码一般是由web服务器完成的，并不需要人为参与，特殊情况下，可以通过UrlDecode方法对url进行解码。

URL Path编码与解码

UrlPathEncode仅仅编码Url的path部分。

它首先使用UTF8编码对字符串进行转换，将转换后的结果看成ASCII串，然后，将其中的空格替换为%20.

仍以http://hello world.com/test.aspx?name=张三这个url为例，通过UrlPathEncode进行编码的结果为

http://hello%20world.com/test.aspx?name=张三

通过对比，你会发现UrlPathEncode与UrlEncode的不同。对于参数部分并没有起作用，而且空格被编码为%20，而不是+。

常用场景，通过http下载文件的时候，有的网站页面上显示的中文文件名是正常的，但是下载到本地文件名就是乱码，这就是又与没有正确编码造成的，可以通过将文件名通过UrlPathEncode编码后输出，避免乱码的问题。

        protected void Page_Load(object sender, EventArgs e)
        {
            string fileName = "本质论.txt";
            string filePath = Server.MapPath("~/" + fileName);
            //以字符流的形式下载文件
            FileStream fs = new FileStream(filePath, FileMode.Open);
            byte[] bytes = new byte[(int)fs.Length];
            fs.Read(bytes, 0, bytes.Length);
            fs.Close();
            Response.ContentType = "application/octet-stream";
            //通知浏览器下载文件而不是打开
            Response.AddHeader("Content-Disposition", "attachment; filename=" + fileName);
            Response.BinaryWrite(bytes);
            Response.Flush();
            Response.End();
        }

如图所示

使用UrlPathEncode编码后，输出的实际名称为：%e6%9c%ac%e8%b4%a8%e8%ae%ba.txt，但，经过浏览器的分析后，就可以还原为原来的名称了。

UrlToken编码与解码

UrlTokenDecode用于在url中以字符串的形式传递一个字节数组的时候使用，它通过将字节数组转换为一个base64的方式来完成，UrlTokenDecode用于对编码之后的串进行解码。

一个例子，我们在一个页面，初始化一个字节数组，并通过UrlTokenDecode编码，通过Url的方式传递给另一个页面，在另一个页面进行解码。

namespace HttpRequestDemo
{
    public partial class UrlTokenEncode : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
            string name = "wolfy";
            byte[] buffer = Encoding.UTF8.GetBytes(name);
            Response.Redirect("/UrlTokenDecode.aspx?name=" + HttpServerUtility.UrlTokenEncode(buffer));
        }
    }
}

解码

namespace HttpRequestDemo
{
    public partial class UrlTokenDecode : System.Web.UI.Page
    {
        protected void Page_Load(object sender, EventArgs e)
        {
            string name = Request.QueryString["name"];
            Response.Write(Encoding.UTF8.GetString(HttpServerUtility.UrlTokenDecode(name)));
        }
    }
}

结果