一尘不染

Objective-C / Cocoa Touch中的HTML字符解码

html

首先,我发现了这一点:目标CHTML转义/转义,但对我不起作用。

我的编码字符(来自RSS feed,顺便说一句)如下所示: &

我在网上搜索了所有内容,并找到了相关的讨论,但是没有解决我的特定编码问题,我认为它们被称为十六进制字符。


阅读 268

收藏
2020-05-10

共1个答案

一尘不染

这些被称为字符实体引用。当采用它们的形式时,&#<number>;它们称为_数字实体引用_ 。基本上,它是应该替换的字节的字符串表示形式。在的情况下&#038;,它表示ISO-8859-1字符编码方案中值为38的字符&

必须在RSS中对与号进行编码的原因是它是保留的特殊字符。

你需要做的是分析该字符串和匹配的值的字节替换实体&#;。我不知道在目标C中执行此操作的任何好方法,但是此堆栈溢出问题可能会有所帮助。

编辑:自从两年前回答这个问题以来,有一些很好的解决方案;请参阅下面的@Michael Waterfall答案。

2020-05-10