我正在为我的应用程序创建一个RSS feed文件,在其中我想删除HTML标签,该操作由完成strip_tags。但是strip_tags不删除HTML特殊代码字符:
strip_tags
& ©
等等
请告诉我任何可用于从字符串中删除这些特殊代码字符的函数。
使用解码html_entity_decode或使用删除它们preg_replace:
html_entity_decode
preg_replace
$Content = preg_replace("/&#?[a-z0-9]+;/i","",$Content);
编辑:根据雅科的评论的替代
用{2,8}或其他内容替换’+’可能会很好。当出现未编码的“&”时,这将限制替换整个句子的机会。
$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);