因此,我有一个字符串数组,所有字符串都使用系统默认的 ANSI 编码,并从SQL数据库中提取。因此,存在256个不同的可能字符字节值(单字节编码)。 有没有一种方法可以使我json_encode()工作并显示这些字符,而不必utf8_encode()在我的所有字符串上使用并最终得到类似的东西\u0082?
json_encode()
utf8_encode()
\u0082
还是这是JSON的标准?
有没有一种方法可以使json_encode()工作并显示这些字符,而不必在所有字符串上都使用utf8_encode()并以“ \ u0082”之类的内容结尾?
如果你有一个ANSI编码的字符串,使用utf8_encode()的是 错误的 函数来处理这个问题。您需要先将其从ANSI正确转换为UTF-8。这肯定会减少Unicode转义序列的数量,例如\u0082从json输出中获取,但是从技术上讲,这些序列对json有效,您不必担心。
json_encode 仅 适用于UTF-8编码字符串。如果需要从编码的字符串成功创建有效的字符串,则需要将其重新编码/转换为first。然后将按文档所述工作。 __json``ANSI``UTF-8``json_encode
json_encode
UTF-8
json``ANSI``UTF-8``json_encode
要将编码从ANSI(更正确地说,我假设您有一个Windows-1252编码的字符串,该字符串很流行,但错误地称为ANSI)转换为UTF-8您可以使用以下mb_convert_encoding()函数:
ANSI
Windows-1252
mb_convert_encoding()
$str = mb_convert_encoding($str, "UTF-8", "Windows-1252");
PHP中另一个可以转换字符串的编码/字符集的函数是iconv基于libiconv调用的。您也可以使用它:
iconv
$str = iconv("CP1252", "UTF-8", $str);
utf8_encode()只为Latin-1而不是为ANSI。因此,当您通过该函数运行字符串时,将破坏该字符串中的部分字符。
Latin-1
有关返回内容的更细粒度控制json_encode(),请参见预定义常量列表(取决于PHP版本,包括PHP 5.4,某些常量尚未记录,仅到目前为止在源代码中可用)。
正如您在注释中写道,将函数应用于数组有问题,这是一些代码示例。它 总是 需要 先 更改编码使用前json_encode。这只是一个标准的数组操作,比较简单的情况下pdo::fetch()一个foreach迭代:
pdo::fetch()
foreach
while($row = $q->fetch(PDO::FETCH_ASSOC)) { foreach($row as &$value) { $value = mb_convert_encoding($value, "UTF-8", "Windows-1252"); } unset($value); # safety: remove reference $items[] = array_map('utf8_encode', $row ); }