




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
:音丑S-'i蘭歌;
清華大學計算機系列教材鄭緯民湯志忠編著
高華尢學出版社■.
TSINGHUAUNIVERSITYPRESS
―二匚「‘一匕盤7,工二:=<..:-",《.'二一'二/一£-二<:??,一..一…:工二—^-=人
課程介紹
高華十字出版社
1.課程名稱
ComputerArchitecture
計算機系統(tǒng)結(jié)構計算機體系結(jié)構
建筑物的設計或式樣,通常指一個系統(tǒng)的外貌
2.研究內(nèi)容
從外部來研究計算機系統(tǒng)
使用者所看到的物理計算機的抽象
編寫出能夠在機器上正確運行的程序所必須
了解到的計算機屬性
清華廣學出版社瑞&一
建立計算機系統(tǒng)的完整概念
學習計算機系統(tǒng)的分析方法和設計方法
了解計算機系統(tǒng)的最新研究成果
4.學科方向
一級學科1個:計算機科學與技術
二級學科3個:計算機系統(tǒng)結(jié)構、計算機軟
件及理論、計算機應用技術
全國重點學科:計算機系統(tǒng)結(jié)構、計算機應
用技術
清華/二學揖版拉二里題云
5.與其他學科的交叉
學科交叉:計算機組成、操作系統(tǒng)、匯編語言、
數(shù)據(jù)結(jié)構、微計算機技術、計算機網(wǎng)
絡、...
新內(nèi)容:超標量處理機、超流水線處理機、
VLIW處理機、向量處理機、并行處理機、
多處理機、互連網(wǎng)絡、……
計算機系統(tǒng)結(jié)構正處于變革時期
軟件-系統(tǒng)結(jié)構-實現(xiàn)技術,兩頭發(fā)展快中間慢
非馮計算機正興起
系統(tǒng)結(jié)構的發(fā)展時期已經(jīng)到來
6.課程安排
課內(nèi):64學時,
實驗:16學時,
課內(nèi)外比例:課內(nèi)1:課外>1
除完成作業(yè)之外,還要多看參考書
多看好論文(被SCI、EI收錄),了解國內(nèi)外
最新研究成果
7.教材和參考書
教材:清華大學計算機系列教材:計算機系統(tǒng)
結(jié)構(第二版),清華大學出版社
高華」學出版社
緣等書:
(l)DavidA.PattersonandJohnL.Hennessy,
ComputerArchitecture:AQuantitativeApproach
3Ed.SanFrancisco:MorganKaufmann
Publishers
中文:計算機系統(tǒng)結(jié)構:一種定量的方法(第
二版,第三版即將出版),清華大學出版社
(2)KaiHwang,AdvancedComputerAcrchitecture
ParallelismScalabilityProgrammability
中文:高等計算機系統(tǒng)結(jié)構:并行性可擴展
性可編程性,清華大學出版社、廣西科學技
術出版社
高華十字出版社
第1章基本概念
1.1計算機系統(tǒng)結(jié)構簡介
12計算機系統(tǒng)的評價標準
1.3計算機系統(tǒng)的設計技術
1.4計算機系統(tǒng)結(jié)構的發(fā)展
1.5計算機系統(tǒng)的分類
1.1計算機系統(tǒng)結(jié)構簡介
1.1.1為什么要研究系統(tǒng)結(jié)構
1.1.2如何認識計算機系統(tǒng)
1.1.3計算機系統(tǒng)結(jié)構的定義
1.1.4計算機組成技術
1.1.5計算機實現(xiàn)技術
清華方字出扳社君晶.
,IfIf,,,,**II'/、/?|>>f.*,F~^~*?■
1.1.1為什么要研究系統(tǒng)結(jié)構
1.提高處理機運算速度:MIPS=FzxlPC
其中:Fz為處理機的工作主頻
IPC(lnstructionPerCycle)為
每個時鐘周期平均執(zhí)行的指令條數(shù)
提高IPC:依靠先進系統(tǒng)結(jié)構
過去,幾個或幾十個周期完成一條指令
現(xiàn)在,一個周期完成幾條指令
提高Fz:縮短門電路延遲,依靠技術進步
流水線技術等,依靠先進系統(tǒng)結(jié)構
從指令串行執(zhí)行,至UP4的20級流水線
清華方字出版社,蔻,----
2.計算機性能提高的幾個階段
20世紀70年代末之前,大型機和小型機計算機性能每年
提高25%?30%°
20世紀80年代初,出現(xiàn)微處理機,依靠集成電路技術,
性能每年提高35%
20世紀80年中期,出現(xiàn)RISC技術、高級語言和操作系
統(tǒng)等,性能每年提高50%
1995年,先進系統(tǒng)結(jié)構對微處理器性能的貢獻是單純技
術進步的5倍。
3.近幾年及將來,計算機性能按摩爾定理發(fā)展。
4.計算機系統(tǒng)的設計者們要不斷創(chuàng)新。
清土學杜版------
1.1.2如何認識計算機系統(tǒng)
1.虛擬計算機
定義:從不同角度所看到的計算機系統(tǒng)的屬性
是不同的。
主要觀察角度包括:
應用程序員
系統(tǒng)程序員
硬件設計人員
對計算機系統(tǒng)的認識通常只需要在某一個層次
上
高華十字出版社
虛擬計算機系統(tǒng)
觀察者
瑞華大學出版社
2.計算機系統(tǒng)的層次結(jié)構
?計算機系統(tǒng)可分為7個層次
?第3級至第6級由軟件實現(xiàn),稱為虛擬機
?從學科領域來劃分:
第0級和第1級屬于計算機組成原理
第2級屬于計算機系統(tǒng)結(jié)構
第3至第5級屬于系統(tǒng)軟件
第6級屬于應用軟件
?它們之間有交叉
例如:第3級必須依賴第4級和第5級來實現(xiàn)
清華方字出擊.社
洲『穿甲叨列?蚤寅學Fa中提
計算機系統(tǒng)的層次結(jié)構
高華十字出版社
清華方字出瓶社一篇總一
?J―/」.,J'JJ二X/*.'一X7JJJ一^」--二X,JJ'~,‘-J二/二/
3.透明性概念
?定義:本來存在的事物或?qū)傩裕瑥哪撤N角度
看似乎不存在
?例如:CPU類型、型號、主存儲器容量等
對應用程序員透明
對系統(tǒng)程序員、硬件設計人員等不透明
?例如:浮點數(shù)表示、乘法指令
對高級語言程序員、應用程序員透明
對匯編語言程序員、機器語言程序員不透明
?例如:數(shù)據(jù)總線寬度、微程序
對匯編語言程序員、機器語言程序員透明
對硬件設計人員、計算機維修人員不透明
清華十學出扳社一潟K--
?J-/」?'J''一?JJ—A/*?二Z'?JJJ—jJ*-―/?"JJ'/J2一^,二/-X
1.1.3計算機系統(tǒng)結(jié)構的定義
計算機系統(tǒng)結(jié)構定義一
Amdahl于1964年在推出IBM360系列計
算機時提出:
程序員所看到的計算機系統(tǒng)的屬性,即概念性結(jié)
構和功能特性
程序員:系統(tǒng)程序員(包括:匯編語言、機器
語言、編譯程序、操作系統(tǒng))
看到的:編寫出能在機器上正確運行的程序所
必須了解到的
主既令*,生幺吉木勾
I彘/136^系列計算機的概念性結(jié)構
信單/:字追成任w
功能特性指令系統(tǒng)及其執(zhí)行模式…
?數(shù)據(jù)表示:硬件能夠直接認別和處理的數(shù)據(jù)類型;
?尋址技術:編址方式、尋址方式和定位方式等;
■寄存器組織:操作數(shù)寄存器、變址寄存器、控制寄存
器及專用寄存器的定義、數(shù)量和使用規(guī)則等;
?指令系統(tǒng):操作類型、格式,指令間的排序控制等;
?中斷系統(tǒng):中斷類型、中斷級別和中斷響應方式等;
?存儲系統(tǒng):尋址空間、虛擬存儲器、Cache存儲器
等;
?處理機工作狀態(tài):定義和切換方式,如管態(tài)和目態(tài)
等;
?輸入輸出系統(tǒng):數(shù)據(jù)交換方式、交換過程的控制等;
?信息俁護:信息保護方式和藕件對信息保護的支持等
清華玄字出版社工薪鼠,,--
2.計算機系統(tǒng)結(jié)構定義三
研究軟硬件功能分配和對軟硬件界面的確定
計算機系統(tǒng)由軟件、硬件和固件組成,它們在
功能上是同等的。
同一種功能可以用硬件實現(xiàn),也可以用軟件或
固件實現(xiàn)。
不同的組成只是性能和價格不同,他們的系統(tǒng)結(jié)
構是相同的。
系列計算機概念:相同系統(tǒng)結(jié)構,不同組成和實
現(xiàn)的一系列計算機系統(tǒng)。
高華;;二字出版社石夕二入/婚不"--
一~.l.咨障機組成技術I
1.課程名稱
ComputerOrganization
計算機組成,計算機組織,計算機原理,計
算機組成原理
2.研究方法
從內(nèi)部研究計算機系統(tǒng)
計算機組成是指計算機系統(tǒng)結(jié)構的邏輯實現(xiàn)。
清華廣孚出版社-
*,**/,->???IA*??,r.、■,一!*,*?>
_,,ijj—,jj二/尸.'JJjjJ,j-,■"「__z./
3.主要研究內(nèi)容
?確定數(shù)據(jù)通路的寬度;
?確定各種操作對功能部件的共享程度;
?確定專用的功能部件;
?確定功能部件的并行度;
?設計緩沖和排隊策略;
?設計控制機構;
?確定采用何種可靠性技術。
高華尢學出版社
1.1.5計算機實現(xiàn)技術
計算機實現(xiàn)是指計算機組成的物理實現(xiàn)主要包
括:
處理機、主存儲器等部件的物理結(jié)構;
器件的集成度和速度;
專用器件的設計;
器件、模塊、插件、底版的劃分與連接;
信號傳輸技術;
電源、冷卻及裝配技術,制造工藝及技術等。
隨著技術、器件和應用的發(fā)展,三者之間的界
限越來越模糊。
高華十字出版社
1.2計算機系統(tǒng)的評價標準
1.2.1運算速度
1.2.2存儲器系統(tǒng)
1.2.3其他性能
1.2.4價格標準
高華十字出版社1.抑隗算速施展
運算速度是表示處理機性能的主要指標。
有多種表示處理機運算速度的方法。
哪一種表示方法合理?
1.時鐘頻率(處理機主頻)
只能用于同一公司、同一類型、同一配置的處理機
如:Pentium42.0G比Pentium41.6G快25%?
Pentium42.4G比Pentium4L6G快50%?
只表示CPU的指令處理能力
實際運算速度還與Cache、內(nèi)存、I/O、被執(zhí)行程序
等均有關。
2.指令執(zhí)行速度
?一種經(jīng)典的表示運算速度的方法
MIPS(MillionInstructionsPerSecond),GIPS,TIPS
N4TDS指令條數(shù)FZ
MIPS="一,、------==——=IPCxFz
執(zhí)行時間義1。6CPI
其中:Fz為處理機的工作主頻
CPI(CyclesPerInstruction)為
每條指令所需的平均時鐘周期數(shù)
IPC(InstructionPerCycle)為
每個時鐘周期平均執(zhí)行的指令條數(shù)
例1:計算PentiumlV2GHz處理機的指令執(zhí)行速度。
清華廣學出版梃.."7辦“我:蕊急各滲擊之4"~"
?解:由于PentiumlV2GHz處理機的
IPC=4(或CPI=0.25),
Fz=2000MHz
因止匕,MIPSPentiumIV2G=FzxIPC=2000x4
=8000MIPS=8GIPS
即每秒鐘80億次(平均每秒鐘執(zhí)行80億條指令)
?主要優(yōu)點:直觀、方便。目前還經(jīng)常使用
?主要缺點:
(1)不同指令的執(zhí)行速度差別很大
(2)指令使用頻度差別很大
(3)有相當多的非功能性指令
3.尊效軸令速度:
吉普森(Gibson)法:加減法50%,乘法15%,
除法5%,程序控制15%,其他15%
靜態(tài)指令使用頻度:在程序中直接統(tǒng)計
動態(tài)指令使用頻度:在程序執(zhí)行過程中統(tǒng)計
等效指令執(zhí)行時間T=£(TimeiXWeighti)
i=l
1
等效指令速度MIPS=-------------
Weighti
rrMIPS
n
等效CPI=£(CPIixWeighti)
i=l
清華廣學圜版社--
例2:我國早期研制的二種小型計算機DJS-130
定點16位,加法指令每秒50萬次,但沒有
硬件乘除法指令。用軟件實現(xiàn)乘除法,速
度低100倍左右。求等效指令速度。
解:等效指令速度為:
1
等效指令速度MIPS=———=0.02MIPS
U.oUu.zu、
(z-----+----------)
0.50.5/100
即每秒2萬次,
由于用軟件實現(xiàn)乘除法,等效指令速度降
低了25倍。
高華大學出瓶社
例3:假設在一般程序中浮點開平方操作FPSQR所占
的比例為2%,它的CPI為100;其他浮點操作
FP所占的比例為23%,它的CPI=4.0;其余
75%指令的CPI=L33,計算該處理機的等效
CPIo如果FPSQR操作的CPI也為4.0,重新計算
等效CPI。
解:等效CPIi=100x2%+4x23%+L33x75%=3.92
等效CPI2乙=4x25%+L33x75%=2.00
改進了在用戶程序中僅占2%的開平方操
作,整個機器的等效運算速度提高了近一倍。
清華十學出版社二基
4.指令執(zhí)行速度的4種平均方法
?算術平均:ltTimel
11i=l
?調(diào)和平均(用速率來度量):寸1
臺Ratei
?加權平均
§加權算術平均:7STimeiXWeightl
1
§加權調(diào)和平均:★Weighti
i=lRatei
高華廣字出版社
?幾何平均:
其中:n指不同的程序,ETR(executiontime
ratio)i是第i個程序相對于參考機器正交化后的
執(zhí)行時間
幾何平均速度與所參考的機器無關,有如下
性質(zhì):
X1的幾何平均值
的幾何平均值
丫的幾何平均值
幾何平均值的比率等于比率的幾何平均值
例4:兩個程序在三臺機器上的執(zhí)行時間
|機器A機器B機器C.
程序Pl(秒)IW20-
程序P2(秒)100010020
運行程序P1時,A的速度是B的10倍;
運行程序P2時,B的速度是A的10倍;
運行程序P1時,A的速度是C的20倍;
運行程序P2時,C的速度是A的50倍;
運行程序P1時,B的速度是C的2倍;
運行程序P2時,C的速度是B的5倍。
算術平均:........
程序P1和P2各執(zhí)行1次,B的速度是A的9.1倍;
程序P1和P2各執(zhí)行1次,C的速度是A的25倍;
程序P1和P2各執(zhí)行1次,C的速度是B的2.75倍。
結(jié)論:
執(zhí)行程序P1和P2相同次數(shù),
機器A最慢,機器C最快
算術平均速度:三臺機器的速度之比為:
A:B:C=1:9.1:25
滑將[學出浙社:薪-
加權算術平均W1三臺機器的速度:AvBvC加權
算術平均W2三臺機器的速度:AvCvB加權算術
平均W3三臺機器的速度:C<B<A
機器A機器B機器C
程序Pl執(zhí)行時間(s)11020
程序P2執(zhí)行時間(s)100010020
加權W1(0.5,0.5)500.5055.0020.00
力口權W2(0.909,0.091)91.9118.1920.00
力口權W3(0.999,0.001)2.0010.0920.00
清華方學出血社」:謁工--
幾何平均mim
幾何平均值與所參考的機器無關,機器A與機器B
的性能相同,機器C的執(zhí)行時間是機器A或機器B的
0.63倍。
執(zhí)行程序P1和P2的總時間,機器A幾乎是機器B
的10倍。
執(zhí)行時間與A正交與B正交與C正交
正交化ABCABCABC
程序P]1.010.020.00.11.02.00.050.51.0
程序P21.00.10.0210.01.00.250.05.01.0
算術平均1.05.0510.015.051.01.125.032.751.0
幾何平均1.01.00.631.01.00.631.581.581.0
總時間比1.00.110.049.11.00.3625.032.751.0
清華丈學出版社—
5.核心程序法QI刪IM3厘-
把應用程序中使用最頻繁的那部分程序作為評價計
算機性能的標準程序。稱為基準測試程序(benchmark)
?整數(shù)測試程序:Dhrystone
用C語言編寫,100條語句。包括:各種賦值語句,數(shù)
據(jù)類型和數(shù)據(jù)區(qū),控制語句,過程調(diào)用和參數(shù)傳送,整數(shù)
運算和邏輯操作等。
VAX-11/780的測試結(jié)果為每秒1757個Dhrystones,
即:1VAXMIPS=1757Dhrystones/Second
?浮點測試程序:Linpack
用FORTRAN編寫,主要是浮點加法和浮點乘法操作
用MFLOPS(MillionFloatingPointOperationsPer
Second)表示,GFLOPS>TFLOPS
高均尢學出物
?SPEC顯準程序SystemPerformanceEvaluationCooperative
由30個左右世界知名計算機大廠商所支持的
非盈利性國際合作組織,包括:舊M、AT&T、
BULL、Compaq、CDC>DG、DEC>Fujitsu>HP、
InteLMIPS、Motolola>SGI、SUN、Unisys等;
1989年10月宣布SPEC1.0,程序量超過15萬
行,包含4個定點程序和6個浮點程序,測試結(jié)果
用SPECint,89和SPECfp,89表示。
1992年增加到有6個定點程序和14個浮點程
序,測試結(jié)果用SPECint'92和SPECfp'92表示。
1995年推出SPECint'95和SPECfp'95
SPEC2000,12個定點程序、14個浮點程序
?SPEC基準測試程序舉例
處理機SPECint'95
SPECfp'95
Pentiumll45018.513.3
Pentiumlll45018.713.7
Pentiumlll50020.614.7
Pientiumlll55022.315.6
Celeron300A12.09.66
Celeron33313,110.20
Celeron36614.110.70
Celeron40015.111.20
Celeron43316.111.60
Celeron46617.012.00
清華廣學出擊.社.
~~*fI*-r***j*?>4(7->f、,F-^-■*■b
Pentium4性能評測數(shù)據(jù)
(數(shù)據(jù)全部來源于Intel網(wǎng)站)
Pentium41.5G1.6G1.7G1.8G1.9G2G2AG2.2G2.4G
SPECint2000531557579601621640722771819
SPECfp2000605626648667688702732766806
SYSmark2002159166174179186193212227242
NewTekLight5min5min5min4min4min4min4min3min4min
Wave3D7.0b51sec29sec11sec54sec38sec27sec16sec54sec35sec
WebMark2001248258269279288300319333350
WebMark2001-B254268280292299312326342371
WebMark2001-B2B263271282292303315342360369
WebMark2001-B2C236248255263292300326335343
高華尢學出版社
TSINGHUAUNIVERSITYPRESS
―二匚「‘一匕盤7,工二:=<..:-",《.'二一'二/一£-二<:??,一..一…:工二—^-=人
SPECint_base*2OOO一
Windows*XP
高華尢學出版社
TSINGHUAUNIVERSITYPRESS
―二匚「‘一匕盤7,工二:=<..:-",《.'二一'二/一£-二<:??,一..一…:工二—^-=人
SPECfp_base*2OOO一
Pentium?4Processor
高華大學出版社
TSINGHUAUNIVERSITYPRES&
Pentium?4Processor
_IMNGHUAUNIVERSITYPR^SS_
NewT^<*UghtWave*3Dv.7.0b
Pentium?4Processor
Shorterbarsindicatebetterperformance
高華廣學出版社.
TSINGHUAUNIVERSITYPRESS.
WebMark*2001一
Windows*XP
Pentium?4Processor
高華廣字出版社.
TSINGHUAUNIVERSITYPRESS
Pentium?4Processor
高華尢學出版社
TSINGHUAUNIVERSITYPRESS
―二匚「‘一匕盤7,工二:=<..:-",《.'二一'二/一£-二<:??,一..一…:工二—^-=人
高華廣字出版社
TSINGHUAUNIVERSITYPRESS
―二匚「‘一匕盤7,工二:=<..:-",《.'二一'二/一£-二<:??,一..一…:工二—^-=人
高華文學出版社???????
TSINGHUAUNIVERSITYPRESS
FlaskMPEG*vO.6with
DivX*4.11Codec
-Windows*XP
Pentium?4Processor
TSiNGHUA^UNIVEgSITY
Adobe*RnotoShop*v,6.01-
Windows*XP
Pentium?44Processor
Shorterbar$indicatebetterperformance
清華廣字出擊.社谷溫薪;新市,.一——
蜂值指令速度:MIPS、GIPS、TIPS
浮點蜂值速度:MFLOPS、GFLOPS、TFLOPS
例5:一個由36臺計算機組成的Cluster系統(tǒng),每
臺計算機內(nèi)部由4個Pentiumlll700,計算這
個Cluster系統(tǒng)的指令峰值速度。
解:Pentiumlll700MHz,有3條指令流水線,
峰值指令速度為:700x3=2100MIPS
Cluster的峰值指令速度=700x3x36x4
=302400MIPS
即每秒3千億次
1.2.2存儲系一'Mu業(yè)則5I乜物砌
1.存儲層次
第1層:RegisterFiles(寄存器堆)
第2層:Lookahead(先行緩沖站)
第3層:Cache(高速緩沖存儲器)
第4層:MainMemory(主存儲器)
第5層:OnlineStorage(聯(lián)機存儲器)
第6層:Off-lineStorage(脫機存儲器)
第1?3層在CPU芯片內(nèi)部,第4層在主板上,第5
層在機箱內(nèi)(硬盤),第6層依靠手工加載
(VCD/DVD/磁帶/刻錄機等)
肩華廣字出版社
存八
CPU寄存器堆
儲第1層
內(nèi)部
容
量指令和數(shù)據(jù)緩沖棧第2層
越
來
Cache
越第3層
(靜態(tài)隨機存儲器SRAM)度
大
越
每
主存儲器來
位
第4層越
的(DRAM>DDR、RDRAM)
快
價八
格
越聯(lián)機外部存儲器
第層
來(磁盤存儲器等)5
越
便
宜脫機外部存儲器第6層
>
(磁帶、VCD、DVD、刻錄機等)
7目1g,.與^口11位〃jit拓際病師/云汴迪?
?j-」.*rJj、-^fr__?/JJJJ-->J''/'-¥,).」-/
2.尋址空間
程序員可以使用的存儲器容量,即每個程序
的大小
通常有216、224、232、264、.?.
Pentium處理機的尋址空間為4GB
與實際配置的存儲器容量無關
3.存儲容量
實際物理存儲器的大小
通常用KB、MB、GB等表示
建議配置:主存:128MB?512MB
硬盤:40GB?137GB
清華上學出版社噩就驪啼鼎森劇胤|囊
4.主存儲器的種類也^
SDRAM(SynchronousDynamicRandomAccess
Memory)
RDRAM(RAMBUSDRAM)
DDR(DualDateRateDRAM)
5.速度主存度與CPU系統(tǒng)總線速度相匹配
P4系統(tǒng)總線速度400MHz(3200MB/S)或533
DDR:64bitsX333MHz/8=2700MB/S
RDRAM:
16bitsX800MHz/8X2=3200MB/S
6.存儲系統(tǒng)
采用軟件和硬件相結(jié)合的方法,獲得速度高、
容量大、價格便宜的存儲器
高華十字出版社7Ml.■遼7rmv
1.2:3其他性能"‘
1.字長1?幾百位,16位、32位、64位
?由數(shù)據(jù)字長決定,8的倍數(shù),32位、64位等
?可變字長:任意組合
2.數(shù)據(jù)表示
?定點、浮點、邏輯、向量、串、棧、樹、…
?發(fā)展方向之一:自定義數(shù)據(jù)表示
4.指令系統(tǒng)
?CISC(ComplexInstructionSetComputer)復雜指令集計算
機_
?RISC(ReducedInstructionSetComputer)精簡指令集計算
機
?VLIW(VeryLongInstructionWord)超長指令字
4.輸入輸出系統(tǒng)
?輸入輸出系統(tǒng)的組織方式
?中斷系統(tǒng)
?通道處理機
?輸入輸出處理機
5.保護和診斷能力
?程序與數(shù)據(jù)的保護
?診斷能力:檢錯,糾錯,冗余,自診斷能力
?可靠性:RAS技術,可靠性R,可用性A,
可維護性S
高華十學出血社
L2"濟格標準什
1.價格與性能的關系:
?摩爾定理:速度每10年左右提高100倍,
但價格基本維持不變
?用當前同樣的價格,在5年之后能買到性能
高出10倍的計算機
2.硬件與軟件的價格比例:
?硬件在整個計算機系統(tǒng)價格中所占的比例在
下降,軟件所占的比例在上升
?目前軟件價格已經(jīng)超過硬件價格
清華方字出擊.社
軟件所占的成本越來越高
成本
70年代
高均尢學出版社
1.3計算機系統(tǒng)的設計技術
1.3.1計算機設計者的任務
1.3.2軟硬件取舍
1.3.3軟件兼容性
1.3.4計算機系統(tǒng)設計方法
清華十學出瀝社’荒,..
1.3.1計算機設計者的任務
系統(tǒng)結(jié)構設計:包括指令集、存儲系統(tǒng)、總線
結(jié)構、處理器設計等,是軟硬件的分界面
硬件實現(xiàn)技術:相當重要,不同指令集對系統(tǒng)
性能的影響在縮小
應用或市場需求
性能優(yōu)化:可靠性、容錯性、價格與性能
實現(xiàn)的復雜性:硬件實現(xiàn)方案、軟件復雜性、
投放市場時間
性能價格比:必須考慮實現(xiàn)的成本,包括軟件
成本
功能要求應具備或支持的典型特性
戶用領域決定對計算機系統(tǒng)的性能要求
對一系列任務有較好的性能
科學計算具有較好的浮點運算功能
支持COBOL、數(shù)據(jù)庫、和事物處理等功能
軟件兼容級別決定機器可以運行哪些軟件
編程語言級設計者的自由度較大,但需要新的編譯器
目標代碼級系統(tǒng)結(jié)構已經(jīng)確定,無須投資軟件
操作系統(tǒng)要求為支持選定的操作系統(tǒng)所需要的特性
地址空間大非常重要的特性,可能限制程序的運行
內(nèi)存管理頁式或段式等管理方式,現(xiàn)代操作系統(tǒng)需要
安全保護操作系統(tǒng)和應用程序需要
標準市場上已有的,某種需要滿足的標準
浮點格式和算法:IEEE、DEC、IBM等
I/O總線UO設備:VME、SCSLPCL光纖等
編程語言影響指令集:C、FORTAN>COBOL等
網(wǎng)絡對不同網(wǎng)絡的支持:內(nèi)部互連網(wǎng)、Ethernet等
清華大學出版社
[32軟硬件取舍
1.軟硬件的關系
理論上:有兩種極端實現(xiàn)方法:
全硬件機器:操作系統(tǒng)、高級語言、應用等
硬件只有1位加法和分支操作,其他都用軟件
關鍵問題:性能與價格的關系
軟件與硬件實現(xiàn)的特點
硬件實現(xiàn):速度快、成本高;靈活性差、占
用內(nèi)存少
軟件實現(xiàn):速度低、復制費用低;靈活性好、
占用內(nèi)存多
高叫力學出腕
硬件實現(xiàn)的比例越來越高
軟硬件比例
最少硬件目前計算機不可編程
清物二土t
2.從價格因素考慮的軟硬件取舍
假設:硬件設計費為Dh、軟件設計費為Ds、
硬件拷貝費為Ch、軟件拷貝費為Cs,R為軟件
重復出現(xiàn)次數(shù)(占用內(nèi)存、占用介質(zhì)),當臺數(shù)為
V時,每臺的硬件費用和軟件費用之比為:
zDh?、ZDsn
(---+Ch):(——+R?Cs)
VV
由于:Dh?Ds,Ch?Cs,當R很大時,
經(jīng)常使用的基本功能適宜用硬件實現(xiàn)
由于:Ds?Cs,當V很大時,生產(chǎn)臺數(shù)很多
時適宜用硬件實現(xiàn)
高華廣字出版社
3,從改進性能考慮的軟硬件取舍
基本方法:加快經(jīng)常性事件的執(zhí)行速度
Amdahl定律:系統(tǒng)中某一部件由于采用更快的
執(zhí)行方式后,整個系統(tǒng)性能的提高與這種執(zhí)
行方式的使用頻率或占總執(zhí)行時間的比例有
關。
在Amdahl定律中,加速比與兩個因素有關:
可改進部分的執(zhí)行時間
可改進部分的比例:Fe
改進前整個任務的執(zhí)行時間
改進前改進部分的執(zhí)行時間
改進部分的加速比:Se=
改進后改進部分的執(zhí)行時間
激軌學出版了二.
改進后整個任務的執(zhí)行時間為:
Tn—To,(1_Fed)
Se
其中:T0為改進前的整個任務的執(zhí)行時間。
改進后整個系統(tǒng)的加速比達到:
c_To_1
Tn(1-Fe)+&
oe
其中:Fe表示可改進部分所占的百分比,
(1-Fe)表示不可改進部分所占的百分比,
Se表示改進后,可改進部分的加速比。
清華大學出版社
?j_,,J.J,―/jj/r二/'/j>j*,>-}/*j**/.,\'?x
例5:某部件的處理時間僅為整個運行時間的
40%,如果將該部件的處理速度加快到10
倍,則采用加快措施后能使整個系統(tǒng)的
性能提高多少?
解:由題意可知:Fe=0.4,Se=10?
根據(jù)Amdahl定律,加速比為:
11
Sn=----------=-------=1.56
(1-0.4)+T0-64
10
4.改進性能的主要途徑"酒眄
(1)面向目標代碼改進
方?jīng)_.用一冬指令代替一出指令
根據(jù)計算結(jié)應改進:例如,增加硬件乘法和硬
件除法指令能夠,使等效指令速度提高25倍,
據(jù)統(tǒng)計數(shù)據(jù)改進指令功能:
如數(shù)據(jù)傳送指令、快速保存與恢復現(xiàn)場指令等
8088中的指令靜態(tài)使用頻度%動態(tài)使用頻度%
MOVE24.8517.14
PSHU103611.11
POP4.142.61
合計39.3531.16
增加運算型指令的功能:如函數(shù)運算指令等
⑵面向高級語言和編譯程序改進:
方法:增強對高級語言和編譯程序支持的指令
的功能
賦值IFGOTOI/ODOCALL也
FORTRAN46.011.510.56.54.56.015.0
COBOL49.619.119.18.460.170.173.4
例如:在do循環(huán)中,循環(huán)體只
1=1111
有一二條的占60%左右,增加―
循環(huán)控制指令。循環(huán)體
例如:條件碼對高級語言幾乎
無用,在并行計算機中已經(jīng)取
消條件碼。
清華廣學姍疏B:野赤力----—
(3)面向操作系統(tǒng)添進:
系統(tǒng)結(jié)構設計要規(guī)整,消除例外情況。
寄存器定義要統(tǒng)一(如A寄存器等)
操作要均勻(如A-B與B-A)
所有的存儲部件都要對稱
進程的管理和切換
存儲管理和信息保護
進程的同步與互斥,信號燈管理
處理機工作狀態(tài)和訪問方式的轉(zhuǎn)換
這類指令的使用頻度往往很低,但必須設置
高華大字出版社加1-
1.3.3軟件兼容性設計方法二2
原因:軟件相對于硬件的成本越來越貴,
已積累了大量成熟的系統(tǒng)軟件和應用軟件。
1兼容^種
(1)向后兼容:在某一時間生產(chǎn)的機器上運行的目標
軟件能夠直接運行于更晚生產(chǎn)的機器上。
(2)向前兼容:
(3)向上兼容:在低檔機器上運行的目標軟件能夠直
接運行于高檔機器上。
(4)向下兼容:
向后兼容必須做到,向上兼容盡量做到
向前兼容和向下兼容,可以不考慮
方法一:系列機方法
系列機定義:
具有相同的系統(tǒng)結(jié)構,但組成和實現(xiàn)技術不
同的一系列計算機系統(tǒng)
實現(xiàn)方法:
在系統(tǒng)結(jié)構基本不變的基礎上,根據(jù)不同的
性能和不同的器件,研制出多種性能和價格不
同的計算機系統(tǒng)。
一種系統(tǒng)結(jié)構可以有多種組成,一種組成也
可以有多種物理實現(xiàn)
如舊M370系列機:
115,125,135,145,158,168等
清華)二字出版社一w一
相同的指令系統(tǒng),采用順序執(zhí)行、重迭、流水
和并行處理方式
相同的32位字長,數(shù)據(jù)通路寬度為8位、16位、
32位、64位。
如PC系列機有:
不同主頻:4.7MHz,500MHz,1GHz,
2.4GHz,3GHz,...
不同擴展:Pentium、PentiumPro>
PentiumMMX、PentiumSSE、Pentium
SSE2
不同Cache:Pentium、Celeron、Xeon
不同字長:8位、16位、32位、64位
采用系列機方法的主要斃翳
(1)系列機之間軟件兼容,可移植性好
(2)插件、接口等相互兼容
(3)便于實現(xiàn)機間通信
(4)便于維修、培訓
(5)有利于提高產(chǎn)量、降低成本
采用系列機方法的主要缺點:
限制了計算機系統(tǒng)結(jié)構的發(fā)展
如PC系列機,其系統(tǒng)結(jié)構非常落后,使用也
最普及
清華廣孚出血社,工"各|宓由/-----
方法二:模擬與仿真SimulationEmulation
定義:在一臺現(xiàn)有的計算機上實現(xiàn)另一臺計算
機的指令系統(tǒng)。全部用軟件實現(xiàn)的叫模擬,
用軟件、硬件、固件混合實現(xiàn)的叫仿真
模擬的實現(xiàn)方法
在A計算機上通過解釋或編譯實現(xiàn)B計算機的
指令系統(tǒng)。A機器稱為宿主機,B機器稱為虛
擬機。
仿真的實現(xiàn)方法
直接用A機器的一段微程序解釋執(zhí)行B機器的
指令。A機器稱為宿主機,B機稱為目標機。
優(yōu)缺點比較
模擬方法速度低,仿真方法速度高
仿真需要較多的硬件(包括控制存儲器)
系統(tǒng)結(jié)構差別大的機器難于用仿真方法實現(xiàn)
除了指令系統(tǒng)之外,還有存儲系統(tǒng)、I/O系統(tǒng)、
中斷系統(tǒng)、控制臺的操作等
模擬方法用于計算機系統(tǒng)的設計過程
在一臺已有的機器上用模擬方法實現(xiàn)正在設
計中的機器的指令系統(tǒng)等。具體過程如下:
設計方案&模擬宜性能評價&修改設計&投產(chǎn)
清華十學出扳社,If?''—,**j???I*f-j?1,IF",^?—>--
方法三:統(tǒng)一高級語言
實現(xiàn)方法:采用同一種不依賴于任何具體機
器的高級語言編寫系統(tǒng)軟件和應用軟件。
困難:至今還沒有這樣一種高級語言,短期
內(nèi)很難實現(xiàn)。C、Ada、Java、...
三種方法比較:
采用統(tǒng)一高級語言最好,是努力的目標
系列機是暫時性方法,也是目前最好的方法
仿真的速度低,芯片設計的負擔重,目前用
于同一系列機內(nèi)的兼容,1/10?1/2的芯片面
積用于仿真
清華廣學出版社鼻
方法四:目標代碼的并行編譯技術
一個新的研究課題
一種機器的目標代碼重新編譯到另一種機器
的并行目標代碼
兩種方法:
(1)動態(tài)代碼轉(zhuǎn)換
例1:舊M公司研制DAISY(Dynamically
ArchitectedInstructionSetfromYorktown)處
理機
例2:Transmeta公司研制Crusoe處理機
已經(jīng)大量應用于筆記本計算機,其功耗很低。
(2)靜態(tài)重編譯:正在研究過程中,難度很大
高華廣學出膽社小R
動態(tài)代碼轉(zhuǎn)換技術
采用動態(tài)二進制轉(zhuǎn)換技術實現(xiàn)與X86等處理機兼容,
把X86等通用處理機的程序直接映射到VLIW處理機
中執(zhí)行。
舊M公司推出了開放源代碼DAISY,它不僅可以實現(xiàn)
舊M的VLIW處理器與X86處理機之間的二進制兼
容,還可以實現(xiàn)PowerPC、S/390、舊M的Java虛
擬機與VLIW處理器之間的二進制兼容
Transmeta公司推出了“CodeMorphingSoftware55,
這種軟件可以保證Transmeta公司的VLIW處理機
Crusoe能夠與X86處理機之間實現(xiàn)二進制代碼兼容
清華廣學出版社
1.3.4計算機系統(tǒng)設計過程
方法1:由上向下(Top-Down)
設計過程:由上向下
面向應用的數(shù)學模型一面向應用的高級語言
一面向這種應用的操作系統(tǒng)一面向操作系統(tǒng)
和高級語言的機器語言一面向機器語言的微
指令系統(tǒng)和硬件實現(xiàn)
應用場合:專用計算機的設計
特點:對于所面向的應用領域,性能和性能價
格比很高。隨著通用計算機價格降低,目前
已經(jīng)很少采用
高華尢學出的歹泡
方法2:由下向上(Bottom-Up)
設計過程:
根據(jù)當時的器件水平,設計微程序機器級和
傳統(tǒng)機器級f根據(jù)不同的應用領域設計多種
操作系統(tǒng)、匯編語言、高級語言編譯器等f
最后設計面向應用的用戶級
應用場合:通用計算機的一種設計方法,在計
算機早期設計中(60?70年代)廣為采用
特點:容易使軟件和硬件脫節(jié),整個計算機系
統(tǒng)的效率降低。
方法3:中間開始(Middle-Out)
用于系列計算機的設計過程中
應用虛擬機
高級語言虛擬機
匯編語言虛擬機向牛
操作系統(tǒng)虛擬機___________
從中間開始
傳統(tǒng)機器級、
微程序級_________向中
硬聯(lián)邏輯級
高華尢學出版社.—
方法3:中間開始(Middle-Out)”?^^?
設計過程:
首先定義軟硬件的分界面(指令系統(tǒng)、存儲系
統(tǒng)、輸入輸出系統(tǒng)、中斷系統(tǒng)、硬件對操作
系統(tǒng)和編譯系統(tǒng)的支持等)
然后各個層次分別進行設計(軟件設計人員設
計操作系統(tǒng)、高級語言、匯編語言、應用程
序等,硬件設計人員設計傳統(tǒng)機器、微程序、
硬聯(lián)邏輯等)
應用場合:用于系列機的設計
特點:軟硬件人員結(jié)合、同時設計,軟硬件功
能分配合理。
1.4計算機系統(tǒng)的發(fā)展
1.4.1馮?諾依曼結(jié)構
1.4.2器件發(fā)展的影響
1.4.3應用發(fā)展的影響
1.4.4改進算法的影響
清華方字出版社
—」-—二二二一;m奧幽出口口/
1.4.1馮?諾依曼結(jié)構
VanNenmann基本思想于1936年?1946年期
間形成,由馮?諾依曼等人于1946年提出
高華上學出版社焉?層飄麗JU黑…zNMNM^H|g
1,特點:存儲程序、運算器為中總:%中控制
存儲器是字長固定的、順序線性編址的一維結(jié)
構,每個地址是唯一定義的。
4096個字、40位。
由指令形式的低級機器語言驅(qū)動。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車庫雨蓬施工方案
- 2025至2030年中國介電強度測試儀數(shù)據(jù)監(jiān)測研究報告
- 《第二單元 信息的存儲與管理 7 共享端午節(jié)信息》教學設計-2023-2024學年南方版(湖南)(2019)信息技術五年級下冊
- 其他地區(qū)2024年新疆伊犁職業(yè)技術學院招聘13人筆試歷年參考題庫附帶答案詳解
- 醫(yī)院建設資金與資源可行性研究
- 船舶拆解施工方案
- 保定2024年河北保定市清苑區(qū)招聘教師135人筆試歷年參考題庫附帶答案詳解
- 佛山2024年廣東佛山市中醫(yī)院三水醫(yī)院招聘高層次人才4人筆試歷年參考題庫附帶答案詳解
- 人教版 (新課標)選修36 能源和可持續(xù)發(fā)展教學設計
- 最高額擔保范例二零二五年
- 河南省建筑工程定額說明和計算規(guī)則
- ICICLE之禾陳列調(diào)研
- GB/T 42172-2022精油產(chǎn)品標簽標識通則
- 課程思政教學展示-空巢老人學與思
- 專職消防員及消防文員報名登記表
- 染料甲基橙的制備
- 熱烈歡迎領導蒞臨指導ppt模板
- 新版母嬰保健法律制度
- 幸福比優(yōu)秀更重要
- 磨床設備點檢表
- TWSJD 002-2019 醫(yī)用清洗劑衛(wèi)生要求
評論
0/150
提交評論