一尘不染

golang / python zlib的区别

go

调试Python的zlib和golang的zlib之间的差异。为什么以下结果没有相同?

compress.go

package main

import (
    "compress/flate"
    "bytes"
    "fmt"
)


func compress(source string) []byte {
    w, _ := flate.NewWriter(nil, 7)
    buf := new(bytes.Buffer)

    w.Reset(buf)
    w.Write([]byte(source))
    w.Close()

    return buf.Bytes()
}


func main() {
    example := "foo"
    compressed := compress(example)
    fmt.Println(compressed)
}

compress.py

from __future__ import print_function

import zlib


def compress(source):
    # golang zlib strips header + checksum
    compressor = zlib.compressobj(7, zlib.DEFLATED, -15)
    compressor.compress(source)
    # python zlib defaults to Z_FLUSH, but 
    # https://golang.org/pkg/compress/flate/#Writer.Flush
    # says "Flush is equivalent to Z_SYNC_FLUSH"
    return compressor.flush(zlib.Z_SYNC_FLUSH)


def main():
    example = u"foo"
    compressed = compress(example)
    print(list(bytearray(compressed)))


if __name__ == "__main__":
    main()

结果

$ go version
go version go1.7.3 darwin/amd64
$ go build compress.go
$ ./compress
[74 203 207 7 4 0 0 255 255]
$ python --version
$ python 2.7.12
$ python compress.py
[74, 203, 207, 7, 0, 0, 0, 255, 255]

Python版本具有0第五个字节,但golang版本具有4-是什么导致不同的输出?


阅读 388

收藏
2020-07-02

共1个答案

一尘不染

python示例的输出不是“完整”流,它只是在压缩第一个字符串后刷新缓冲区。您可以通过替换Close()为从Go代码获得相同的输出Flush()

https://play.golang.org/p/BMcjTln-ej

func compress(source string) []byte {
    buf := new(bytes.Buffer)
    w, _ := flate.NewWriter(buf, 7)
    w.Write([]byte(source))
    w.Flush()

    return buf.Bytes()
}

但是,您比较在Python从zlib的输出,它使用内部紧缩实现生产zlib的格式输出,并且flate在Go,这
一个DEFLATE实现。我不知道是否可以获取python
zlib库来输出原始的,完整的DEFLATE流,但是尝试获取不同的库来输出压缩数据的逐字节匹配似乎并不有用或无法维护。压缩库的输出仅保证是兼容的,而不是完全相同的。

2020-07-02