c#中过滤html的正则表达式

实现代码

///  
///  去除HTML标记
///  
///  包括HTML的源码  
///  已经去除后的文字
public static string NoHTML(string Htmlstring)
{
  //删除脚本
  Htmlstring = Regex.Replace(Htmlstring, @"", "",
  RegexOptions.IgnoreCase);
  //删除HTML 
  Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",
  RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"([rn])[s]+", "",
  RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"–>", "", RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"",
  RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", "  ",
  RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "xa1", RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "xa2", RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "xa3", RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "xa9", RegexOptions.IgnoreCase);
  Htmlstring = Regex.Replace(Htmlstring, @"&#(d+);", "", RegexOptions.IgnoreCase);
  Htmlstring.Replace("<", "");
  Htmlstring.Replace(">", "");
  Htmlstring.Replace("rn", "");
  Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();
  return Htmlstring;
}

C#过滤Html标签及空格

public static string FilterHTML(string HTMLStr)
    {
      if (!string.IsNullOrEmpty(HTMLStr))
 return System.Text.Regularexpressions.Regex.Replace(HTMLStr, "<[^>]*>| ", "");
      else
 return "";
    }

写一个静态方法移除HTML标签

#region
///  
///  移除HTML标签
///  
///  HTMLStr
public static string ParseTags(string HTMLStr)
{
 return System.Text.Regularexpressions.Regex.Replace(HTMLStr, "<[^>]*>", "");
}
#endregion

取出文本中的图片地址

#region
///  
///  取出文本中的图片地址
///  
///  HTMLStr
public static string GetImgUrl(string HTMLStr)
{
 string str = string.Empty;
 string sPattern = @"^]*>";
 Regex r = new Regex(@"]*s*srcs*=s*([']?)(?S+)'?[^>]*>",
  RegexOptions.Compiled);
 Match m = r.Match(HTMLStr.ToLower());
 if (m.Success)
  str = m.Result("${url}");
 return str;
}
#endregion

提取HTML代码中文字的C#函数

///  
///  提取HTML代码中文字的C#函数
///  
///  包括HTML的源码  
///  已经去除后的文字
using System;
using System.Text.Regularexpressions;
public class StripHTMLTest
{
 public static void Main()
 {
  string s = StripHTML(
   "中国石龙信息平台faddfs龙信息平台");
  Console.WriteLine(s);
 }

 public static string StripHTML(string strHtml)
 {
  string[]aryReg =
  {
   @"",

   @"<(/s*)?!?((w+:)?w+)(w+(s*=?s*(([""'])(\["
    "'tbnr]|[^7])*?7|w+)|.{0})|s)*?(/s*)?>", @"([rn])[s]+", @
    "&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @
    "&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);",
    @"&(copy|#169);", @"&#(d+);", @"-->", @"


热门相关搜索



路由器设置
木托盘
宝塔面板
儿童python教程
心情低落
朋友圈
vim
双一流学科
专升本
我的学校
日记学校
西点培训学校
汽修学校
情书
化妆学校
塔沟武校
异形模板
西南大学排名
最精辟人生短句
6步教你追回被骗的钱
南昌大学排名
清朝十二帝
北京印刷学院排名
北方工业大学排名
北京航空航天大学排名
首都经济贸易大学排名
中国传媒大学排名
首都师范大学排名
中国地质大学(北京)排名
北京信息科技大学排名
中央民族大学排名
北京舞蹈学院排名
北京电影学院排名
中国戏曲学院排名
河北政法职业学院排名
河北经贸大学排名
天津中德应用技术大学排名
天津医学高等专科学校排名
天津美术学院排名
天津音乐学院排名
天津工业大学排名
北京工业大学耿丹学院排名
北京警察学院排名
天津科技大学排名
北京邮电大学(宏福校区)排名
北京网络职业学院排名
北京大学医学部排名
河北科技大学排名
河北地质大学排名
河北体育学院排名







学习工具
代数计算器
三角函数
解析几何
立体几何


知识解答
教育知识
百科知识
生活知识
常识知识


写作必备
作文大全
作文素材
句子大全

实用范文


关于我们
关于我们
联系我们
网站地图


 
名师互学网交流群


名师互学网客服





名师互学网 版权所有 (c)2021-2022      ICP备案号：晋ICP备2021003244-6号
 






关于我们
文章归档
网站地图
联系我们
版权所有 (c)2021-2022 MSHXW.COM
ICP备案号：晋ICP备2021003244-6号