计算机体系结构量化研究方法1
经典重读,温故知新.
突然发现,此乃本人专业,竟陌生如此
第一章 量化设计与分析基础
- 计算机生产技术的发展和计算机设计技术的创新
- 新体系结构商业成功源于人们不再使用汇编语言进行编程,降低了对目标代码兼容性的要求;出现了独立于厂商的标准化操作系统
- RISC精简指令集系统,80年代出现,使设计人员专注于两方面的研究:指令级并行(流水线,多指令发射);缓存的使用
- Intel是将80x86指令转化为类似于RISC的指令,由于晶体管数量的飞速发展,再转化成RISC指令时的硬件开销可忽略不计,但在低端应用中,这种转化开销带来的开销与硅面积成本,使得ARM成为了主流,这也是一种RISC体系结构
- 现在的大型计算机和高性能超级计算机也是由微处理器组合而成的
- SPEC基准测试
- 计算机体系结构和技术改进
- 即时编译器Just-in-time和跟踪编译Trace-based compiling正在替代传统的编译器和链接器
- 因特网上的软件即服务Software as a Service正在取代必须在本地计算机上安装的盒装光盘套装软件
- 风冷芯片最大功耗和无法有效地开发更多指令级并行这两大孪生瓶颈使得单核处理器性能不能快速的提高,多核成为了主流
- 处理器性能的提高从单纯的依赖指令级并行ILP到转向数据级并行DLP和线程级并行TLP
- 个人移动设备PMD
- 响应性能和可预测性能是多媒体应用程序的关键特性
- 针对服务器,可用性至关重要,高吞吐量
- 最大规模集群,仓库级计算机WSC
- 多种级别的并行度现在已经成为计算机设计的推动力量,而能耗和成本则是主要的约束条件
- 应用程序中主要有两种并行:数据级并行DLP和任务级并行TLP
- 计算机硬件四种方式:指令级并行/向量体系结构和图行处理器GPU/线程级并行/请求级并行
- 分类:单指令流单数据流SISD/单指令流多数据流SIMD/多指令流单数据流MISD(暂无)/多指令流多数据流MIMD
- 指令集设计,功能组织,逻辑设计,实现方式(集成电路设计,包装,电池,冷却..)
- 指令集体系结构ISA
- MIPS 80x86 ARM MIPS64指令集
- 存储器寻指,都是按字节寻指
- 寻指模式.例MIPS寻指模式:寄存器寻指,立即数寻指,位移量寻址
- 操作数的类型和大小
- 操作指令:数据传输,逻辑运算,算术运算...
- 控制流指令:条件转移,无条件跳转,过程调用,返回等
- ISA编码:固定长度和可变长度;ARM和MIPS都是32位指令长度,80x86可变
- 组成和硬件,组成也叫微体系结构;指令级相同但组成不同的处理器如:AMD Opteron和Intel Core i7
- 同一系列的计算机通常具有相同的指令集体系结构和几乎相同的组成,但提供不同的存储系统和时钟速率
- 集成电路逻辑技术;半导体DRAM;半导体闪存;磁盘技术;网络技术
- 集成电路工艺用特征尺寸来衡量:一个晶体管或一条连线在x或y方向上的最小尺寸,目前2011达到32nm,22nm
- 晶体管的性能提高大体上与特征尺寸的下降成线性关系,晶体管数目以平方增长
- 一段连线的信号延迟与其电阻,电容的乘积成正比,特征尺寸缩小时,连线变短,单位长度的电阻和电容都会变差
- 一般来说,与晶体管性能相比,连线延迟方面的改进小得可怜,增加了设计人员面临的挑战,连线延迟已经成为了大型集成电路的主要设计限制,往往比晶体管开关延迟还要关键,越来越多的时钟周期被消耗在信号在连线上的传播延迟上
- 功率是设计人员面临的最大挑战:功率引入芯片进行分配,而为仅仅为电源和接地就使用了数以百万计的晶体管和多个互连层;功率以热的形式耗散,必须消除 1.性能,功率,能耗
- 持续功耗,用热设计功耗TDP来度量,决定冷却需求.TDP不是峰值功率,峰值功率大约是其1.5倍
- 对于CMOS芯片来说,传统的主要能耗是开关晶体管,也叫动态能耗