asp.net C#过滤html标签几个函数

时间：2022-06-25 08:01:40 编辑：袖梨来源：一聚教程网

在项目中遇到这样一个需求，需要将一段html转换为一般文本返回，万能的正则表达式来了。

正则表达式来拯救你，代码如下：

代码如下

复制代码

public static string Html2Text(string htmlStr)
{

if ( String .IsNullOrEmpty(htmlStr))

{

return "" ;

}

string regEx_style = "

string regEx_script = "

string regEx_html = "]+>" ; //定义HTML标签的正则表达式

htmlStr = Regex .Replace(htmlStr, regEx_style, "" ); //删除css

htmlStr = Regex .Replace(htmlStr, regEx_script, "" ); //删除js

htmlStr = Regex .Replace(htmlStr, regEx_html, "" ); //删除html标记

htmlStr = Regex .Replace(htmlStr, "\s*|t|r|n" , "" ); //去除tab、空格、空行

htmlStr = htmlStr.Replace( " " , "" );

htmlStr = htmlStr.Replace( """ , "" ); //去除异常的引号" " "

htmlStr = htmlStr.Replace( """ , "" );

return htmlStr.Trim();

}

代码二

以下是引用片段：
　　-----

代码如下

复制代码

/**/
///

/// 去除HTML标记
///

/// 包括HTML的源码
/// 已经去除后的文字
public static string NoHTML(string Htmlstring)
{
//删除脚本
Htmlstring = Regex.Replace(Htmlstring, @"", "",
RegexOptions.IgnoreCase);
//删除HTML
Htmlstring = Regex.Replace(Htmlstring, @"]*)>", "",
RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"([rn])[s]+", "",
RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
Htmlstring = Regex.Replace(Htmlstring, @"", @"

推荐专题

最新下载

热门教程

asp.net C#过滤html标签几个函数

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程