在SSRS 2005(VB.NET)中从字符串中剥离HTML

时间:2020-03-05 18:45:08  来源:igfitidea点击:

我的SSRS数据集返回带有HTML的字段,例如

<b>blah blah </b><i> blah </i>.

如何剥离所有HTML标记?必须通过内联VB.NET完成

不能更改表中的数据。

找到解决方案... = System.Text.RegularExpressions.Regex.Replace(StringWithHTMLtoStrip," <[^>] +>","")

解决方案

回答

这是一个使用正则表达式的好例子:http://www.4guysfromrolla.com/webtech/042501-1.shtml

回答

如果我们知道HTML的格式正确,可以确保它具有根节点,可以将该字段中的数据转换为System.Xml.XmlDocument,然后从中获取InnerText值。

同样,我们将必须确保文本具有根节点,如果有需要,我们可以添加根节点,因为这无关紧要,并确保HTML格式正确。

回答

谢谢Daniel,但我需要以内联方式完成...这是解决方案:

= System.Text.RegularExpressions.Regex.Replace(StringWithHTMLtoStrip," &lt;[^>] +>","")

这里是链接:

http://weblogs.asp.net/rosherove/archive/2003/05/13/6963.aspx
http://msdn.microsoft.com/en-us/library/ms157328.aspx

回答

如果我们不想使用正则表达式(例如,如果需要更好的性能),则可以尝试我前一段时间写在CodeProject上的一种小方法。