  • 时间:2012-01-13 04:01:18
更好的办法是将这一雷格斯简化为一种更可怕的形式,但我似乎无法适当实施特征小组,以供再利用。 关于如何更好地实现这一匹配的任何其他建议都将得到赞赏。


<Formatting Type="B">any text</Formatting>


<Formatting Type="B"><Formatting Type="I">any text</Formatting>any text</Formatting>


最终目标是以标准的超文本标签取代<B> <I> <U>等所有条目。


Overall Regex is the following

<Formatting Type="[BIU]{1}">([40w!?:.]*(<[BIU]>)*[40w!?:.]*(</[BIU]>)*[40w!?:.]*)*</Formatting>


<Formatting Type="([BIU])">([ w!?:.]*(?:</?[BIU]>[ w!?:.]*)*)</Formatting>

没有必要为开放和关闭超文本标签单独生产,比你需要区分<代码><B>、<I><U>。 重要的是,在您配对开标之后,您不消费任何more在截止日期之前的开标;/Formatting>。 如果原始标签被正确地封顶,那么超文本标签也将是这样。

我假定只有三种类型的格式,在案文中就没有其他的角逐或类似的东西。 既然如此,你就不需要与监管机构那样严格限制。

text = Regex.Replace(text,
    @"<Formatting Type=""([BIU])"">([^<]*(?:</?[BIU]>[^<]*)*)</Formatting>",

当然,你需要从案文上多发通行证,以确保你能够更换所有标签。 根据你的样本案文:

<Formatting Type="B"><Formatting Type="I">any text</Formatting>any text</Formatting>


<Formatting Type="B"><I>any text</I>any text</Formatting>


<B><I>any text</I>any text</B>


您可能希望避免陷入疯狂状态,因为https://stackoverflow.com/questions/1732348/regex-match- open-tags-gh-xhtml-sol-tags/1732454#1732454“显然,StackOverflow用户是



