浮点精细度( 二 )


浮点精细度

文章插图
在这个二进制扩展中 , 让我们表示从0(最左边的位或最高有效位)到32(最右边的位)的位置 。24位有效位将在位置23停止 , 如上面带下划线的位0所示 。下一位 , 在位置24 , 被称为圆位舍位位 。它用于将33位近似值四捨五入为最接近的24位数(对于中途值有特定的规则 , 这里不是这种情况) 。在这个例子中 , 该位是1 , 被加到由最左边的24位形成的整数上 , 产生:
浮点精细度

文章插图
当这是使用IEEE 754编码存储在存储器中 , 这成为有效数小号 。假定有效位在最左边的位右边有一个二进制点 。可以要求非零数字的有效位的最高有效位数不为零(除非相应的指数小于最小数字) 。这个过程被称为规範化 。对于二进制格式(仅使用数字0和1) , 此非零数字必须为1 。因此 , 它不需要在记忆体中表示;允许格式有更多的精度 。这个规则被不同地称为前导位约定 , 隐式位约定隐藏位约定 。浮点数範围浮点数由两个定点组件组成 , 其範围完全取决于表示中的位数或位数 。虽然分量线性取决于它们的範围 , 但是浮点範围线性地依赖于指数分量範围内的显着範围和指数函式 , 这在数量上显着地增大了範围 。在典型的计算机系统中 , “双精度”(64位)二进制浮点数的係数为53位(其中一个隐含) , 指数为11位 , 符号位为1 。由于指数的範围是[-1022,1023] , 而308大约是log10(2) , 所以此格式的正浮点数的範围大约在10到10 。格式的完整範围从大约-10到+10(见IEEE 754) 。系统(B , P , L , U)中的归一化浮点数的数量B是系统的基础 , 
P是系统对P数的精度 , 
L是系统中可表示的最小指数 , 
ü是在系统中使用的最大的指数)

浮点精细度

文章插图
有一个最小的正归一化浮点数 , 下溢级别
浮点精细度

文章插图
其中以1为前导数字 , 0为有效数字的剩余数字 , 以及指数的最小可能值 。有一个最大的浮点数 , 溢出级别
浮点精细度

文章插图
其中B-1是有效数字的每个数字的值 , 并且是指数的最大可能值 。另外 , 在-UFL和UFL之间还有可表示的值 。即 , 正数和负数的零 , 以及非规格化的数字 。IEEE 754:现代计算机中的浮点浮点精度16位:一半(二进制16)
32位:单(binary32) , 十进制32
64位:Double(binary64) , decimal64
128位:四(binary128) , DECIMAL128
256位:八进制(binary256)
扩展精度格式(40位或80位)
Minifloat
微软二进制格式
IBM浮点体系结构
任意精度
v
?
?
在IEEE标準化二进制浮点数字的计算机表示在IEEE 754在1985年(又名IEC 60559)这个第一标準之后 , 几乎所有现代机器 。2008年进行了修订 。IBM大型机除支持IEEE 754二进制格式外 , 还支持IBM自己的十六进制浮点格式和IEEE 754-2008十进制浮点数 。在克雷T90系列有一个IEEE版本 , 但SV1仍然使用的Cray浮点格式 。该标準提供了许多密切相关的格式 , 只有少数细节不同 。其中五种称为