在SSRS 2005(VB.NET)中从字符串中剥离HTML-IGI

时间：2020-03-05 18:45:08 　来源:igfitidea点击:

我的SSRS数据集返回带有HTML的字段，例如

<b>blah blah </b><i> blah </i>.

如何剥离所有HTML标记？必须通过内联VB.NET完成

不能更改表中的数据。

找到解决方案... = System.Text.RegularExpressions.Regex.Replace(StringWithHTMLtoStrip，" <[^>] +>"，"")

解决方案

这是一个使用正则表达式的好例子：http://www.4guysfromrolla.com/webtech/042501-1.shtml

如果我们知道HTML的格式正确，可以确保它具有根节点，可以将该字段中的数据转换为System.Xml.XmlDocument，然后从中获取InnerText值。

同样，我们将必须确保文本具有根节点，如果有需要，我们可以添加根节点，因为这无关紧要，并确保HTML格式正确。

谢谢Daniel，但我需要以内联方式完成...这是解决方案：

= System.Text.RegularExpressions.Regex.Replace(StringWithHTMLtoStrip，" <[^>] +>"，"")

这里是链接：

http://weblogs.asp.net/rosherove/archive/2003/05/13/6963.aspx
http://msdn.microsoft.com/en-us/library/ms157328.aspx

如果我们不想使用正则表达式(例如，如果需要更好的性能)，则可以尝试我前一段时间写在CodeProject上的一种小方法。