手机
当前位置:查字典教程网 >编程开发 >asp.net教程 >asp.net 网页编码自动识别代码
asp.net 网页编码自动识别代码
摘要:复制代码代码如下:usingSystem;usingSystem.Net;usingSystem.Text;usingSystem.Text...

复制代码 代码如下:

using System;

using System.Net;

using System.Text;

using System.Text.RegularExpressions;

class Program

{

// 获取网页的HTML内容,根据网页的charset自动判断Encoding

static string GetHtml(string url)

{

return GetHtml(url, null);

}

// 获取网页的HTML内容,指定Encoding

static string GetHtml(string url, Encoding encoding)

{

byte[] buf = new WebClient().DownloadData(url);

if (encoding != null) return encoding.GetString(buf);

string html = Encoding.UTF8.GetString(buf);

encoding = GetEncoding(html);

if (encoding == null || encoding == Encoding.UTF8) return html;

return encoding.GetString(buf);

}

// 根据网页的HTML内容提取网页的Encoding

static Encoding GetEncoding(string html)

{

string pattern = @"(?i)bcharset=(?<charset>[-a-zA-Z_0-9]+)";

string charset = Regex.Match(html, pattern).Groups["charset"].Value;

try { return Encoding.GetEncoding(charset); }

catch (ArgumentException) { return null; }

}

// 程序入口

static void Main()

{

Console.WriteLine(GetHtml(http://www.jb51.net));

Console.Read();

}

}

【asp.net 网页编码自动识别代码】相关文章:

asp图片防盗链的代码

asp.net下文件上传和文件删除的代码

asp.net下实现URL重写技术的代码

asp.net下经典数据库记录分页代码

asp.net自定义控件代码学习笔记

asp.net(C#) 生成随机验证码的代码

asp.net 多字段模糊查询代码

ASP.net 验证码实现代码(C#)

asp.net动态载入用户控件的方法

.NET 2.0 的压缩功能代码

精品推荐
分类导航