我们的客户向我们提供了需要使用PHP处理的XML数据。他们选择滥用属性,将其用于大块文本(包含换行符)。XML解析器将换行符替换为空格,以使XML符合W3标准。
为了确保我们不会失去我们的分界线,我想在档案中读作一个插图,然后翻译与<代码>和amp;第13号;之间的所有分界线。 我认为,我需要定期表达这一点,但我正与大家一起努力。
这是我迄今为止的测试代码(PHP 5),使用向前和向后查找,但不起作用:
$xml = <tag attribute="Header
First paragraph.">
</tag> ;
$pattern = /(?<=")([^"]+?)
([^"]+?)(?=")/ ;
print_r( preg_replace($pattern, "$1 $2", $xml) );
有人能帮我弄对吗?对于一个有经验的正则表达式大师来说应该很容易:)