实现代码
////// 去除HTML标记 /// /// 包括HTML的源码 ///已经去除后的文字 public static string NoHTML(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"", "", RegexOptions.IgnoreCase); //删除HTML Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"([rn])[s]+", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"–>", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "xa1", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "xa2", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "xa3", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "xa9", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"(d+);", "", RegexOptions.IgnoreCase); Htmlstring.Replace("<", ""); Htmlstring.Replace(">", ""); Htmlstring.Replace("rn", ""); Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); return Htmlstring; }
C#过滤Html标签及空格
public static string FilterHTML(string HTMLStr)
{
if (!string.IsNullOrEmpty(HTMLStr))
return System.Text.Regularexpressions.Regex.Replace(HTMLStr, "<[^>]*>| ", "");
else
return "";
}
写一个静态方法移除HTML标签
#region ////// 移除HTML标签 /// /// HTMLStr public static string ParseTags(string HTMLStr) { return System.Text.Regularexpressions.Regex.Replace(HTMLStr, "<[^>]*>", ""); } #endregion
取出文本中的图片地址
#region ////// 取出文本中的图片地址 /// /// HTMLStr public static string GetImgUrl(string HTMLStr) { string str = string.Empty; string sPattern = @"^]*>"; Regex r = new Regex(@"]*s*srcs*=s*([']?)(?S+)'?[^>]*>", RegexOptions.Compiled); Match m = r.Match(HTMLStr.ToLower()); if (m.Success) str = m.Result("${url}"); return str; } #endregion
提取HTML代码中文字的C#函数
////// 提取HTML代码中文字的C#函数 /// /// 包括HTML的源码 ///已经去除后的文字 using System; using System.Text.Regularexpressions; public class StripHTMLTest { public static void Main() { string s = StripHTML( "中国石龙信息平台 faddfs龙信息平台"); Console.WriteLine(s); } public static string StripHTML(string strHtml) { string[]aryReg = { @"", @"<(/s*)?!?((w+:)?w+)(w+(s*=?s*(([""'])(\[" "'tbnr]|[^7])*?7|w+)|.{0})|s)*?(/s*)?>", @"([rn])[s]+", @ "&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @ "&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);", @"&(copy|#169);", @"(d+);", @"-->", @"热门相关搜索路由器设置 木托盘 宝塔面板 儿童python教程 心情低落 朋友圈 vim 双一流学科 专升本 我的学校 日记学校 西点培训学校 汽修学校 情书 化妆学校 塔沟武校 异形模板 西南大学排名 最精辟人生短句 6步教你追回被骗的钱 南昌大学排名 清朝十二帝 北京印刷学院排名 北方工业大学排名 北京航空航天大学排名 首都经济贸易大学排名 中国传媒大学排名 首都师范大学排名 中国地质大学(北京)排名 北京信息科技大学排名 中央民族大学排名 北京舞蹈学院排名 北京电影学院排名 中国戏曲学院排名 河北政法职业学院排名 河北经贸大学排名 天津中德应用技术大学排名 天津医学高等专科学校排名 天津美术学院排名 天津音乐学院排名 天津工业大学排名 北京工业大学耿丹学院排名 北京警察学院排名 天津科技大学排名 北京邮电大学(宏福校区)排名 北京网络职业学院排名 北京大学医学部排名 河北科技大学排名 河北地质大学排名 河北体育学院排名



