c# 网站生成静态页面

在一些需要经常更新页面数据的网站中,一般访问量不是很大的都直接发布的是带后台代码,每次访问都是有数据库交互的。但是一旦访问量增加了,那么这些服务器开销变成本就要考虑进来了,像一些文章,后台编辑后,文章内容存入数据库,如果1000人访问,如果还是每次取数据库,那这1000次的io访问就显得比较大了,一个好的方法就是,文章确定之后,做成静态页面,而这个做的方法由程序来做,就是递归遍历整个网站,将网站内容都访问一遍,然后生成这些页面的静态文本页面,在将这些页面发布,这样对浏览者而言,他看到的还是同一个地址,同一份文章,只是这份是静态的而言。这样就提升了网站的效率节约了资源;

下面附上一份C#遍历网站内容,然后生成内容页面代码;

[csharp] view plain copy
 
  1. private ArrayList htmlCreatedList = new ArrayList();  
  2.   
  3.         /// <summary>  
  4.         /// 递归实现页面静态化功能  
  5.         /// </summary>  
  6.         /// <param name="urlString">要访问的页面链接地址</param>  
  7.         public void SaveHtmlCode(string urlString)  
  8.         {  
  9.             if (htmlCreatedList.Contains(urlString))  
  10.             {  
  11.                 return;  
  12.             }  
  13.             string htmlCode = GetHtmlCodeFromUrl(urlString);  
  14.             string htmlPath = urlString.ToPhysicalPath();  
  15.             string direcHtmlPath = Path.GetDirectoryName(htmlPath);  
  16.             if (!Directory.Exists(direcHtmlPath))  
  17.             {  
  18.                 Directory.CreateDirectory(direcHtmlPath);  
  19.             }  
  20.             File.WriteAllText(htmlPath, htmlCode);  
  21.             htmlCreatedList.Add(urlString);  
  22.             var urlList = GetUrlLinkFromHtmlCode(htmlCode);  
  23.             string urlTemp = string.Empty;  
  24.             foreach (string url in urlList)  
  25.             {  
  26.                 urlTemp = url;  
  27.                 urlTemp = Regex.Replace(urlTemp, "href\s*=\s*", "");  
  28.                 urlTemp = urlTemp.Replace(""", "");  
  29.                 urlTemp = urlTemp.Replace("\", "/");  
  30.                 urlTemp = WebConfigInfo.UrlPrefix + urlTemp;  
  31.                 SaveHtmlCode(urlTemp);  
  32.             }  
  33.         }  
  34.   
  35.         /// <summary>  
  36.         /// 通过HttpWebRequest页面链接的html代码  
  37.         /// </summary>  
  38.         /// <param name="urlString">页面链接地址</param>  
  39.         /// <returns>页面链接对应的html代码</returns>  
  40.         private string GetHtmlCodeFromUrl(string urlString)  
  41.         {  
  42.             HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);  
  43.             hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";  
  44.             hwRequest.Accept = "*/*";  
  45.             hwRequest.KeepAlive = true;  
  46.             hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");  
  47.             HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();  
  48.             Stream streamResponse = hwResponse.GetResponseStream();  
  49.             StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));  
  50.             string strHtml = readerOfStream.ReadToEnd();  
  51.             readerOfStream.Close();  
  52.             streamResponse.Close();  
  53.             hwResponse.Close();  
  54.             return strHtml;  
  55.         }  
  56.   
  57.         ///<summary>  
  58.         ///正则表达式匹配出html代码中的超链接  
  59.         ///</summary>  
  60.         ///<param name="htmlCode">要找出超链接的html代码</param>  
  61.         ///<returns></returns>  
  62.         private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)  
  63.         {  
  64.             string strRegex = "href\s*=\s*(?:["'](?<1>[^"'.#:]*)["'])";  
  65.             Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);  
  66.             MatchCollection ms = r.Matches(htmlCode);  
  67.             IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");  
  68.             return listUrl.Distinct();  
  69.         }  
  70.     }  


给string 扩展了一个方法。

[csharp] view plain copy
 
    1. public static string ToPhysicalPath(this string urlString)  
    2.        {  
    3.            System.Uri uri = new System.Uri(urlString);  
    4.            string htmlPath = string.Format("{0}\Html\{1}\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);  
    5.            string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);  
    6.            htmlPath += string.Join(string.Empty, querys);  
    7.            htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";  
    8.            htmlPath = htmlPath.Replace("/", "\");  
    9.            htmlPath = htmlPath.Replace("\\", "\");  
    10.            return htmlPath;  
    11.        }  
原文地址:https://www.cnblogs.com/Alex80/p/6959116.html