ASP.NET动态生成html页面。利用WebClient和WebRequest类获得网页源代码

ASP.NET动态生成html页面

    此功能适用于后台数据库功能不强的web站点,即大部分文本不是存放在数据库的记录中,而是放在html文件或者xml文件中,仅仅把索引放到数据库中,如文章标题、类别、查询关键字等。这样适合于后台没有诸如MS Sql Server这样的数据库支持的Web站点。

  适用于新闻发布系统,比如sina、163等都是采用动态生成html页面的。

  适用于需动态定制页面的程序。比如论坛、聊天室等。可以加载定制好的html页面,来加强美观。

  思路

  1. 利用如Dw-Mx这样的工具生成html格式的模板,在需要添加格式的地方加入特殊标记(如$htmlformat$),动态生成文件时利用代码读取此模板,然后获得前台输入的内容,添加到此模板的标记位置中,生成新文件名后写入磁盘,写入后再向数据库中写入相关数据。

  2. 使用后台代码硬编码Html文件,可以使用HtmlTextWriter类来写html文件。

  优点

  1. 可以建立非常复杂的页面,利用包含js文件的方法,在js文件内加入document.write()方法可以在所有页面内加入如页面头,广告等内容。

  2. 静态html文件利用MS Windows2000的Index Server可以建立全文搜索引擎,利用asp.net可以以DataTable的方式得到搜索结果。而Win2000的Index服务无法查找xml文件的内容。如果包括了数据库搜索与Index索引双重查找,那么此搜索功能将非常强大。

  3. 节省服务器的负荷,请求一个静态的html文件比一个aspx文件服务器资源节省许多。

  缺点

  思路二: 如果用硬编码的方式,工作量非常大,需要非常多的html代码。调试困难。而且使用硬编码生成的html样式无法修改,如果网站更换样式,那么必须得重新编码,给后期带来巨大的工作量。

  因此这里采用的是第一种思路

  示列代码

  1.定义(template.htm)html模板页面

<html>

<head>

 <title></title>

 <meta http-equiv="Content-Type" content="text/html; charset=gb2312">

</head>

<body >

<table $htmlformat[0] height="100%" border="0" width="100%" cellpadding="10" cellspacing="0" bgcolor="#eeeeee" style="border:1px solid #000000">

<tr>

<td width="100%" valign="middle" align="left">

<span style="color: $htmlformat[1];font-size: $htmlformat[2]">$htmlformat[3]</span>

</td>

</tr>

</table>

</body>

</html> 

  2.asp.net代码:

//---------------------读html模板页面到stringbuilder对象里----

string[] format=new string[4];//定义和htmlyem标记数目一致的数组

StringBuilder htmltext=new StringBuilder();

try

{

 using (StreamReader sr = new StreamReader("存放模板页面的路径和页面名"))

 {

  String line;

  while ((line = sr.ReadLine()) != null)

  {

   htmltext.Append(line);

  }

  sr.Close();

 }

}

catch

{

 Response.Write("<Script>alert('读取文件错误')</Script>");

}

//---------------------给标记数组赋值------------

format[0]="background="bg.jpg"";//背景图片

format[1]= "#990099";//字体颜色

format[2]="150px";//字体大小

format[3]= "<marquee>生成的模板html页面</marquee>";//文字说明

//----------替换htm里的标记为你想加的内容

for(int i=0;i<4;i++)

{

 htmltext.Replace("$htmlformat["+i+"]",format[i]);

}

//----------生成htm文件------------------――

try

{

 using(StreamWriter sw=new StreamWriter("存放路径和页面名",false,System.Text.Encoding.GetEncoding("GB2312")))

 {

  sw.WriteLine(htmltext);

  sw.Flush();

  sw.Close();

 }

}

catch

{

 Response.Write ("The file could not be wirte:");

  小结

  用此方法可以方便的生成html文件。程序使用了是循环替换,因此对需替换大量元素的模板速度非常快。

=====================================================================================

利用WebClient和WebRequest类获得网页源代码

利用.NET框架提供的 WebClient类 和 WebRequest类,我们可以很轻易地得到给定URL地址的源代码,很简单,以下是C#的完整的例子.

查看例子

GetPageHtml.aspx

<%@ Page language="c#" validateRequest = "false" Codebehind="GetPageHtml.aspx.cs"
 AutoEventWireup="false" Inherits="eMeng.Exam.GetPageHtml" %>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >
<HTML>
  <HEAD>
    <title>得到网页源代码</title>
    <meta name="GENERATOR" Content="Microsoft Visual Studio 7.0">
    <meta name="CODE_LANGUAGE" Content="C#">
    <meta name="vs_defaultClientScript" content="JavaScript">
    <meta name="vs_targetSchema" content="http://schemas.microsoft.com/intellisense/ie5">
  </HEAD>
  <body MS_POSITIONING="GridLayout">
    <form id="aspNetBuffer" method="post" runat="server">
      <div align="center" style="FONT-WEIGHT: bold">得到任意网页源代码</div>
      <asp:TextBox id="UrlText" runat="server" Width="400px">http://dotnet.aspx.cc/content.aspx
       </asp:TextBox>
      <asp:Button id="WebClientButton" Runat="server" Text="用WebClient得到"></asp:Button>
      <asp:Button id="WebRequestButton" runat="server" Text="用WebRequest得到"></asp:Button>
      <br>
      <asp:TextBox id="ContentHtml" runat="server" Width="100%" Height="360px" TextMode="MultiLine">
       </asp:TextBox>
    </form>
  </body>
</HTML>
GetPageHtml.aspx.cs

using System;
using System.Collections;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Web;
using System.Web.SessionState;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.HtmlControls;
using System.IO;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
namespace eMeng.Exam
{
/// <summary>
/// GetPageHtml 的摘要说明。
/// </summary>
public class GetPageHtml : System.Web.UI.Page
{
protected System.Web.UI.WebControls.Button WebClientButton;
protected System.Web.UI.WebControls.Button WebRequestButton;
protected System.Web.UI.WebControls.TextBox ContentHtml;
protected System.Web.UI.WebControls.TextBox UrlText;
protected System.Web.UI.WebControls.Button GetText;
private string PageUrl = "";

private void Page_Load(object sender, System.EventArgs e)
 {}

#region Web Form Designer generated code
override protected void OnInit(EventArgs e)
 {
 InitializeComponent();
 base.OnInit(e);
}

/// <summary>
/// 设计器支持所需的方法 - 不要使用代码编辑器修改
/// 此方法的内容。
/// </summary>
private void InitializeComponent()
{   
 this.WebClientButton.Click += new System.EventHandler(this.WebClientButton_Click);
 this.WebRequestButton.Click += new System.EventHandler(this.WebRequestButton_Click);
 this.GetText.Click += new System.EventHandler(this.GetText_Click);
 this.Load += new System.EventHandler(this.Page_Load);

}
#endregion

private void WebClientButton_Click(object sender, System.EventArgs e)
{
 PageUrl = UrlText.Text;
 WebClient wc = new WebClient();
 wc.Credentials = CredentialCache.DefaultCredentials;

 ///方法一:
 Byte[] pageData = wc.DownloadData(PageUrl);
 ContentHtml.Text = Encoding.Default.GetString(pageData); 


 /// 方法二:
 /// ***************代码开始**********
 /// Stream resStream = wc.OpenRead(PageUrl);
 /// StreamReader sr = new StreamReader(resStream,System.Text.Encoding.Default);
 /// ContentHtml.Text = sr.ReadToEnd();
 /// resStream.Close();
 /// **************代码结束********
 ///
wc.Dispose(); 
}

private void WebRequestButton_Click(object sender, System.EventArgs e)
{
 PageUrl = UrlText.Text;
 WebRequest  request = WebRequest.Create(PageUrl);
 WebResponse response = request.GetResponse();
 Stream resStream = response.GetResponseStream(); 
 StreamReader sr = new StreamReader(resStream, System.Text.Encoding.Default);
 ContentHtml.Text = sr.ReadToEnd();
 resStream.Close();
 sr.Close();
}

private void GetText_Click(object sender, System.EventArgs e)
 {
 PageUrl = UrlText.Text;
 WebRequest  request = WebRequest.Create(PageUrl);
 WebResponse response = request.GetResponse();
 Stream resStream = response.GetResponseStream(); 
 StreamReader sr = new StreamReader(resStream, System.Text.Encoding.Default);
 ContentHtml.Text = sr.ReadToEnd();
 resStream.Close();
 sr.Close();
 ContentHtml.Text = Regex.Replace(ContentHtml.Text,"<[^>]*>", "");
 //替换空格
 ContentHtml.Text = Regex.Replace(ContentHtml.Text,"\\s+", " ");
 }
}
}

猜你喜欢

转载自blog.csdn.net/hljqfl/article/details/86318332
今日推荐