量化

量子化Q具有现实世界的价值v由位的加权和表示。在一般斜率和偏差编码方案中,无符号定点量的值由下式给出

v ~ = s . [ = 0 W s 1. B 2. ] + B ,

而有符号定点数量的值由

v ~ = s . [ B W s 1. 2. W s 1. + = 0 W s 2. B 2. ] + B ,

哪里

  • B 是二进制数字,带有 B = 1. , 0 对于 = 0 , 1. , ... , W s 1.

  • 以位为单位的字大小由ws具有ws=1.,2.,3.,...,128.

  • s是由 F = 2. E ,其中缩放不受限制,因为二进制点不必与字相邻。

B 被称为位乘法器 2. 被称为砝码.

定点格式

下图显示了8位有符号和无符号定点值的格式。

请注意,您不能仅仅通过检查来区分这些数字是有符号的还是无符号的数据类型,因为这些信息没有在单词中显式编码。

二进制数11.0101为无符号和2的补码表示形式生成相同的值,因为MSB=0. 背景B=0使用适当的权重、位乘法器和缩放,值为

v ~ = ( F 2. E ) Q = 2. E [ = 0 W s 1. B 2. ] = 2. 4. ( 0 × 2. 7. + 0 × 2. 6. + 1. × 2. 5. + 1. × 2. 4. + 0 × 2. 3. + 1. × 2. 2. + 0 × 2. 1. + 1. × 2. 0 ) = 3.3125.

相反,二进制数1011.0101自MSB之后,为无符号和2的补码表示形式生成不同的值=1..

背景B=0使用适当的权重、位乘法器和缩放,无符号值为

v ~ = ( F 2. E ) Q = 2. E [ = 0 W s 1. B 2. ] = 2. 4. ( 1. × 2. 7. + 0 × 2. 6. + 1. × 2. 5. + 1. × 2. 4. + 0 × 2. 3. + 1. × 2. 2. + 0 × 2. 1. + 1. × 2. 0 ) = 11.3125 ,

而二者的补值是

v ~ = ( F 2. E ) Q = 2. E [ B W s 1. 2. W s 1. + = 0 W s 2. B 2. ] = 2. 4. ( 1. × 2. 7. + 0 × 2. 6. + 1. × 2. 5. + 1. × 2. 4. + 0 × 2. 3. + 1. × 2. 2. + 0 × 2. 1. + 1. × 2. 0 ) = 4.6875.