我了解整数和浮点数据类型的存储方式,并且我猜测十进制数据类型的可变长度意味着它的存储方式更像字符串。
使用十进制数据类型并针对它们进行搜索时,这是否意味着性能开销?
Pavel说得很对,我只想解释一下。
假设您的意思是与浮点数或定点偏移整数(即,将千分之一的整数存储为整数)相比对性能有影响:是的,对性能有很大影响。PostgreSQL和MySQL的声音用二进制编码的十进制存储DECIMAL/ NUMERIC。这种格式比将数字存储为文本更紧凑,但是使用起来仍然不是很有效。
DECIMAL
NUMERIC
如果您没有在数据库中进行许多计算,则影响将限于与整数或浮点数相比,BCD需要更大的存储空间,因此行更宽,扫描速度更慢,索引更大等。b中的比较操作- tree索引搜索速度也较慢,但这并不重要,除非您由于其他原因已经受到CPU的限制。
如果使用数据库中的DECIMAL/ NUMERIC值进行大量计算,则性能可能会受到影响。至少在PostgreSQL中,这一点尤其明显,因为Pg不能对任何给定查询使用多个CPU。如果您要对数字进行大量除法,乘法,更复杂的数学,聚合等操作,则在使用浮点或整数数据类型时再也找不到CPU的局限了。这在类似OLAP的(分析)工作负载中以及在加载或提取(ETL)期间进行报告或数据转换时尤其明显。
尽管有 是 一个性能的影响(其变化的基础上,从微不足道的工作量相当大),你通常应该使用numeric/ decimal时,它是最合适的类型,你的任务-即在非常高的范围值必须存储和/或倒圆错误是不可接受的。
numeric
decimal
有时,使用bigint和定点偏移量是很麻烦的,但这很笨拙且不灵活。取而代之的是使用浮点数很少是正确的答案,因为要为诸如货币之类的东西可靠地使用浮点数存在所有挑战。
(顺便说一句,我很高兴看到一些新的Intel CPU和IBM Power 7系列CPU都对IEEE 754十进制浮点数提供了硬件支持。如果低端CPU可以使用它,那将是数据库的巨大胜利。 )