一尘不染

Go-解码JSON,因为它仍通过net / http流进

go

过去,我曾经使用go来按照以下所示的方式从API端点解码JSON。

client := &http.Client{}

req, err := http.NewRequest("GET", "https://some/api/endpoint", nil)
res, err := client.Do(req)
defer res.Body.Close()

buf, _ := ioutil.ReadAll(res.Body)

// ... Do some error checking etc ...

err = json.Unmarshal(buf, &response)

我将很快在一个端点上工作,该端点可以使用以下格式向我发送几兆字节的JSON数据。

{
    "somefield": "value",
    "items": [
        { LARGE OBJECT },
        { LARGE OBJECT },
        { LARGE OBJECT },
        { LARGE OBJECT },
        ...
    ]
}

JSON有时会包含一个任意长度的大对象数组。我想将这些对象中的每个对象分别放置到消息队列中。我不需要解码对象本身。

如果我使用普通方法,这将在解码之前将整个响应加载到内存中。

由于响应仍在流中并将其分派到队列中,是否有一种很好的方法可以将每个“大对象”项分开?我这样做是为了避免在内存中保存尽可能多的数据。

谢谢!


阅读 152

收藏
2020-07-02

共1个答案

一尘不染

使用可以解码JSON流json.Decoder

使用Decoder.Decode(),我们可以读取(解组)单个值,而不会消耗和解组整个流。这很酷,但是您的输入是一个“单个”
JSON对象,而不是一系列JSON对象,这意味着对的调用Decoder.Decode()将尝试解组所有项目(大对象)的完整JSON对象。

我们想要的是部分地,即时地处理单个JSON对象。为此,我们可以使用Decoder.Token()哪个仅解析(高级)JSON输入流中的下一个后续令牌并返回它。这称为
事件驱动的 解析。

当然,我们必须“处理”(解释并对其执行操作)令牌,并构建一个“状态机”,以跟踪我们在处理的JSON结构中的位置。

这是解决您问题的实现。

我们将使用以下JSON输入:

{
    "somefield": "value",
    "otherfield": "othervalue",
    "items": [
        { "id": "1", "data": "data1" },
        { "id": "2", "data": "data2" },
        { "id": "3", "data": "data3" },
        { "id": "4", "data": "data4" }
    ]
}

并阅读items,用这种类型建模的“大对象”:

type LargeObject struct {
    Id   string `json:"id"`
    Data string `json:"data"`
}

我们还将解析和解释JSON对象中的其他字段,但是我们只会记录/打印它们。

为了简便起见,我们将使用以下辅助错误处理函数:

he := func(err error) {
    if err != nil {
        log.Fatal(err)
    }
}

现在让我们看一下操作。为了简洁起见,并在Go
Playground上进行了有效的演示,在下面的示例中,我们将从string值中读取。要读取实际的HTTP响应正文,我们只需要更改一行,这就是我们创建方式json.Decoder

dec := json.NewDecoder(res.Body)

因此,演示:

dec := json.NewDecoder(strings.NewReader(jsonStream))
// We expect an object
t, err := dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != '{' {
    log.Fatal("Expected object")
}

// Read props
for dec.More() {
    t, err = dec.Token()
    he(err)
    prop := t.(string)
    if t != "items" {
        var v interface{}
        he(dec.Decode(&v))
        log.Printf("Property '%s' = %v", prop, v)
        continue
    }

    // It's the "items". We expect it to be an array
    t, err := dec.Token()
    he(err)
    if delim, ok := t.(json.Delim); !ok || delim != '[' {
        log.Fatal("Expected array")
    }
    // Read items (large objects)
    for dec.More() {
        // Read next item (large object)
        lo := LargeObject{}
        he(dec.Decode(&lo))
        fmt.Printf("Item: %+v\n", lo)
    }
    // Array closing delim
    t, err = dec.Token()
    he(err)
    if delim, ok := t.(json.Delim); !ok || delim != ']' {
        log.Fatal("Expected array closing")
    }
}

// Object closing delim
t, err = dec.Token()
he(err)
if delim, ok := t.(json.Delim); !ok || delim != '}' {
    log.Fatal("Expected object closing")
}

这将产生以下输出:

2009/11/10 23:00:00 Property 'somefield' = value
2009/11/10 23:00:00 Property 'otherfield' = othervalue
Item: {Id:1 Data:data1}
Item: {Id:2 Data:data2}
Item: {Id:3 Data:data3}
Item: {Id:4 Data:data4}

Go Playground上尝试完整的工作示例。

2020-07-02