数据表示、寻址方式、指令系统

郑振宁2024年4月12日大约 13 分钟

数据表示、寻址方式、指令系统

本章涉及的公式有

浮点计算公式
ROM 查表舍入法
指令格式优化（固、哈、扩）码长公式

真题

简答题（15） ^

【数据表示篇】

简述标志符数据表示的概念和标志符数据表示存在的两个问题 2210

简述数据描述符和标志符的差别 1510 1710 2110

简述标志符数据表示的优点 1610

简述引入数据表示的原则 1604

简述数据表示和数据结构之间的关系及引入高级数据表示的基本原则 1404

简述堆栈计算机的概念及其特点 1804 2204 x

【寻址技术篇】

简述程序的静态再定位和动态再定位的含义及实现方法 1204

【指令系统篇】

简述编译程序设计者要求指令系统应具有的特性。 1810 x

简述CISC存在的问题。0504 0607 1304 1504

简述面向高级语言的优化实现改进CISC指令系统的途径。1710

简述设计RISC的基本原则 2104 1910 1904 1704 0904 0504 0404 x2

简述设计RISC结构采用的基本技术。 2010 1204 1004 0807 x1

简述设计RISC结构的重叠寄存器窗口技术。1410

简述RISC的优缺点。 1107 1104

简述指令字格式优化措施 1604

应用题

尾数下溢-ROM查表舍入法

尾数计算

指令格式优化

1204、2104、2204、2210

1、数据表示 ^ *

简简述标志符数据表示的概念和标志符数据表示存在的两个问题 2210
简简述数据描述符和标志符的差别 1510 1710 2110
简简述标志符数据表示的主要优点 1610
简简述引入数据表示的原则 1604
简简述数据表示和数据结构之间的关系及引入高级数据表示的基本原则 1404

数据表示：能由计算机硬件识别和引用的数据类型。它里头有可对数据进行操作的指令和运算部件。计算机的运算类指令和运算器结构主要是按计算机有什么样的数据表示来确定的。 ^

数据结构：串、队、栈、向量、阵列、链表、树、图等由软件处理的数据结构，反映应用中要用到的各种数据元素或信息单元之间的结构关系。 ·

高级数据表示

标志符数据表示 *
数据描述符 *
向量、数组数据表示
堆栈数据表示

标志符数据表示 ^ *

标志符数据表示：将数据类型和数据放在一起。

图标志符数据表示的表示形式
IMG_9708

标志符数据表示的主要优点：

简化指令系统、程序设计以及编译程序；
由硬件实现一致性检查和数据类型转换；
便于软件调试且支持数据库系统。

标志符数据表示可能带来两个问题：

增加程序占用的主存空间。
降低指令的执行速度。

数据描述符

为进一步减少标志符所占用的存储空间，对向量、数据、记录等数据，采用数据描述符，因为他们的元素属性相同。

图数据描述符的表示形式
image-20230207220205894
image-20230207220445277

标志符与数据描述符的区别 ^*

标志符只作用于一个数据，而数据描述符作用于一组数据。

标志符与数据存放在一起，而描述符与数据分开存放。

向量、数组数据表示 ·

为向量、数组数据结构的实现和快速运算提供更好的硬件支持的方法是增设向量数据表示，组成向量机，如 CRAY-1。有向量数据表示的处理机就是向量处理机，如向量流水机、阵列机、相联处理机。

图
image-20230207221205738

堆栈数据表示 ^ *

堆栈数据结构在编译和子程序调用中很有用，为高效实现，很多机器都设置有堆栈数据表示。有堆栈数据表示的计算机称为堆栈计算机。

通用寄存器型机器对堆栈数据结构实现的支持较差，所以出现了堆栈计算机，其特点：

由高速寄存器组成的硬件堆栈。
有丰富的堆栈操作指令，功能强大。
支持高级语言编译、子程序的嵌套和递归调用。

数据表示的引入原则 * ^

看系统的效率是否显著提高，包括实现时间和存储空间是否显著减少。
看引入这种数据表示后，其通用性和利用率是否提高。

2、浮点数 ** *

📚 🇺🇸 兰德尔E.布莱恩特深入理解计算机系统（第3版）ch2
📚 🇺🇸 贝赫鲁兹·佛罗赞计算机科学导论（第4版） ch3
📚 🇺🇸 内尔·戴尔计算机科学概论（第7版） ch3
📚 🇨🇳 李学干计算机系统机构（12版） ch2

表示方式

尾数：数制（小数或整数）和码制（原码或补码）
- 尾数基值($r_m$)：2、4、、8、16和10进制。
- 尾数位数($m$)：决定可表示数的精度
阶码（$2^p$）：整数，移码（偏码、增码、余码）或补码。
- 阶码基值：通常为2进制。
- 阶值位数($p$)：决定可表示数的范围

结论：尾数决定了浮点数的表示精度，阶值决定了浮点数的表示范围。 简记：尾数决定精度，阶值决定范围

什么是规格化正尾数？
正尾数小数点后的第1个r_m进制数位不是0的数。 ^

计算公式 ^ x3

规律：一般地，$r_m$都是2的整次幂，因此 $r_m^{m{\prime}}=2^m$

计算尾数最值及个数、阶的最值及个数、可表示数的最值及个数。

浮点数尾数基值大小分析（讨论 $r_m$ 取值）[**^]

尾数基值增大，会扩大浮点数表示范围，增加可表示数的个数，减少移位次数，降低右移造成的精度损失，提高运算速度，但也会降低数据的表示精度，数值的分布变稀疏。

$r_m$ ↑ ，可表示数的范围 ↑
$r_m$ ↑ ，可表示数的个数 ↑
$r_m$ ↑ ，运算速度 ↑
$r_m$ ↑ ，数在数轴上的（密度）分布 ↓
$r_m$ ↑ ，可表示数的精度 ↓
$r_m$ ↑ ，精度损失 ↓

因此，可简记：尾基与范个速成正相关，与密精损成负相关。 ^

选浮点数尾数基值大小分析
image-20230305154137350

尾数下溢处理方法 * **

处理办法：简记：截舍恒查

截断法。实现最简单。平均误差最大。
舍入法。最大误差小，平均误差趋于0。
恒置1法。最大误差最大，平均误差趋于0，下溢处理不耗时。
查表舍入法。实现最复杂

2210：平均误差最大的是？截断法。
1204#5A：实现最简单：截断法。
1404#3D：最大误差最大，平均误差趋于0，下溢处理不耗时：恒置1法。

查表舍入法 *

用ROM或PLA存放下溢处理表。

查表舍入法的优缺点：

优点：速度快，平均误差可调节到0；
缺点：硬件量大

查表舍入法填下溢处理表的规则，直接以真题为例 ^

3、寻址技术

编址方式 ·
寻址方式 *
定位方式 *

编址方式

寻址方式^

寻址方式：指令寻找操作数或信息的方式。

寻址方式的三种面向

面向主存、寄存器、堆栈三种寻址方式。 简记：主寄堆

程序在主存中的定位技术

简简述程序的静态再定位和动态再定位的含义及实现方法 1204

静态再定位：程序执行时物理地址不改变。实现方法：在程序装入主存时，由装入程序用软件方法把程序的逻辑地址变换成物理地址。
动态再定位：在执行每条指令时才形成访存物理地址。实现方法：程序执行时，通过地址加法器将逻辑地址和程序基址相加后形成访存物理地址。
虚拟地址映像表。存储体系采用该技术实现定位程序在主存中的位置。

首先，弄清逻辑地址和主存物理地址：逻辑地址：程序员编程用的地址；主存物理地址：程序在主存中的实际地址；这两个术语适用于整个计算机体系。

4、指令系统*^

指令系统的组成

图指令系统的组成
image-20220803194605016
操作码由两部分组成：-
操作种类：加减乘除、移位、转移、输入输出等
操作数描述：定点数、浮点数等
地址码由三部分组成：-
地址：地址码、立即数、寄存器、变址寄存器。
地址的附加信息：偏移量、块长度、跳距。
寻址方式：直接寻址、间接寻址、变址寻址等