一尘不染

如何在PHP中修复格式错误的JSON?

json

我正在获取JSON格式和唯一可用格式的数据提要。在PHP中,我正在使用json_decode解码JSON,但此操作已中断,并且我发现JSON是在某些地方生成的,其昵称用双引号引起来。我使用以下方法验证了这一点:http
:
//jsonformatter.curiousconcept.com

我无法控制数据的创建,但是当这种格式出现时,我必须处理它。解析后的数据将被放入MySQL TABLE。

例如:

"contact1": "David "Dave" Letterman",

json_decode将返回NULL。如果我手动保存文件,然后将其更改为Dave昵称的单引号,则一切正常。

$json_string = file_get_contents($json_download);
$json_array = json_decode($json_string, true);

如何在json_decode处理损坏的JSON_string中修复损坏的JSON格式?要对文件进行预处理,将昵称的双引号反斜杠,该怎么做?还是将它们更改为单引号?在MySQL中存储像这样的双引号甚至是个好主意吗?

我不知道何时每个数据提要都可能发生这种情况,因此我不想只检查contact1是否具有内部双引号来修复它们。PHP中是否有办法采用如上例所示的行,并在冒号之后的所有内容(除外部双引号之外)都反斜杠?谢谢!

这是tftd提供的正确代码:

<?php
// This:
// "contact1": "David "Dave" Letterman",
// Needs to look like this to be decoded by JSON:
// "contact1": "David \"Dave\" Letterman",

$data ='"contact1": "David "Dave" Letterman",';
function replace($match){
    $key = trim($match[1]);
    $val = trim($match[2]);

    if($val[0] == '"')
        $val = '"'.addslashes(substr($val, 1, -1)).'"';
    else if($val[0] == "'")
        $val = "'".addslashes(substr($val, 1, -1))."'";

    return $key.": ".$val;
}
$preg = preg_replace_callback("#([^{:]*):([^,}]*)#i",'replace',$data);
var_dump($preg);
$json_array = json_decode($preg);
var_dump($json_array);
echo $json_array . "\n";
echo $preg . "\n";
?>

这是输出:

string(39) ""contact1": "David \"Dave\" Letterman","
NULL

"contact1": "David \"Dave\" Letterman",

阅读 334

收藏
2020-07-27

共1个答案

一尘不染

正如其他人已经指出的那样,最好将JSON格式的问题告知客户。要求他们将错误报告发送给原始开发者/公司,以便他们进行修复。如果他/他们无法解决-
请提供您的解决方案。您只需要addslashes在字符串之前就可以json_encode了。

如果由于某种原因最终不得不进行fix格式化,则可以采用以下方法:

$data = '"contact1": "David "Dave" Letterman", "contact2": "Peter "Robert" Smith",{\'test\': \'working "something"\'}';
function replace($match){
    $key = trim($match[1]);
    $val = trim($match[2]);

    if($val[0] == '"')
        $val = '"'.addslashes(substr($val, 1, -1)).'"';
    else if($val[0] == "'")
        $val = "'".addslashes(substr($val, 1, -1))."'";

    return $key.": ".$val;
}
$preg = preg_replace_callback("#([^{:]*):([^,}]*)#i",'replace',$data);
var_dump($preg);
// string '"contact1": "David \"Dave\" Letterman", "contact2": "Peter \"Robert\" Smith",{'test': 'working \"something\"'}' (length=110)

请记住,如果有人再次弄乱json格式,这可能会中断。

2020-07-27