我有这个HTML代码:
<p style="padding:0px;"> <strong style="padding:0;margin:0;">hello</strong> </p>
但它应该变成(对于所有可能的html标签):
<p> <strong>hello</strong> </p>
改编自我对类似问题的回答
$text = '<p style="padding:0px;"><strong style="padding:0;margin:0;">hello</strong></p>'; echo preg_replace("/<([a-z][a-z0-9]*)[^>]*?(\/?)>/si",'<$1$2>', $text); // <p><strong>hello</strong></p>
RegExp细分:
/ # Start Pattern < # Match '<' at beginning of tags ( # Start Capture Group $1 - Tag Name [a-z] # Match 'a' through 'z' [a-z0-9]* # Match 'a' through 'z' or '0' through '9' zero or more times ) # End Capture Group [^>]*? # Match anything other than '>', Zero or More times, not-greedy (wont eat the /) (\/?) # Capture Group $2 - '/' if it is there > # Match '>' /is # End Pattern - Case Insensitive & Multi-line ability
添加一些引号,并使用替换文本,<$1$2>它应该删除标记名之后的所有文本,直到标记结尾/>或just 为止>。
<$1$2>
/>
>
请注意, 这不一定适用于 所有 输入,因为Anti-HTML + RegExp会告诉您。有一些后备功能,最明显的是<p style=">">会<p>">失败,还有其他一些坏的问题…我建议将Zend_Filter_StripTags视为PHP中更全面的标签/属性过滤器
<p style=">">
<p>">