一尘不染

如何删除html特殊字符?

php

我正在为我的应用程序创建一个RSS
feed文件,在其中我想删除HTML标签,该操作由完成strip_tags。但是strip_tags不删除HTML特殊代码字符:

  & ©

等等

请告诉我任何可用于从字符串中删除这些特殊代码字符的函数。


阅读 239

收藏
2020-05-26

共1个答案

一尘不染

使用解码html_entity_decode或使用删除它们preg_replace

$Content = preg_replace("/&#?[a-z0-9]+;/i","",$Content);

编辑:根据雅科的评论的替代

用{2,8}或其他内容替换’+’可能会很好。当出现未编码的“&”时,这将限制替换整个句子的机会。

$Content = preg_replace("/&#?[a-z0-9]{2,8};/i","",$Content);
2020-05-26