




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精選優質文檔-傾情為你奉上Question 4A single-issue processor uses tomasulos algorithm in its floating-point unit, which has one adder and one multiplier,each with its own set of reservation station,there is only one CDB ,and broadcast on this CDB takes an entire cycle.the processor is executing the following seq
2、uence of instruction and, for each instruction ,we show the cycle in which the instruction is fetched, decoded, issued, begins to execute,and writes result.單發射處理器在其浮點單元中使用托馬斯算法,其具有一個加法器和一個乘法器,每個具有其自己的一組保留站,只有一個CDB,并且在該CDB上廣播需要整個周期。處理器 正在執行以下指令序列,并且對于每個指令,我們示出指令被取出,解碼,發出,開始執行和寫入結果的周期。instructionfetch
3、decodeissueexecuteWrite resultI1MUL R1,R2,R212348I2ADD R1,R1,R2234910I3MUL R2,R2,R3345813I4ADD R3,R1,R14561112I5MUL R1,R1,R15671216I6ADD R2,R3,R46711?I7ADD R1,R5,?781317181、 what is the latency of the multiplier? 42、 Is the multiplier pipelined? N3、 How many reservation station are there for the add
4、er? 2 4、 In which cycle does I6 begin to execute? 135、 Which register does ? Represent in I7 R16、 If the priory for using CDB depends on the type of instruction,between ADD and MUL the priority for using the CDB goes to _? ADDQuestion 8(書本92頁).Loop: LD R1,0(R2) ;load R1 from address 0+R2DADDI R1,R1,
5、#1 ;R1=R1+1SD R1,0,(R2) ;store R1 at address 0+R2DADDI R2,R2,#4 ;R2=R2+4DSUB R4,R3,R2 ;R4=R3-R2BNEZ R4,Loop ;branch to Loop if R4!=0Assume that the initial value of R3 is R2 + 396.答案:(1)依題意可得,指令序列執行的流水線時空圖如下:1234567891011121314151617181920211IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFI
6、DEXMEWB1IFIFIDEXME時鐘周期為:17*98+18 = 1684 (2)依題意可得,指令序列執行的流水線時空圖如下:1234567891011121314151IFIDEXMEWB2IFIDSEXMEWB3IFSIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB7IFMissMissIFIDEXMEWB 時鐘周期為:10*98+11 = 991 (3) 依題意可得,指令序列執行的流水線時空圖如下:12345678910111IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXME
7、WB1IFIDEXMEWB時鐘周期為:6*98+10 = 598 Question 99a) What is the effective access time of a cache memory system in which there is a 2-way set associative cache, having the following parameters:Parameter: Value:number of sets 1024 setsline size 16 wordscache access time 15 ns/linemain memory access time 70
8、 ns/wordmain memory address space size 256M wordscache hit rate 95%Label the fields of the memory address below used to access the cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _14_ bits Index : _10_ bits Offset : _4_ bits9b) What is the ef
9、fective access time of a cache memory system in which there is a direct mapped level 1 (L1) cache and a fully associative level 2 (L2) cache, having the following parameters:Parameter:Value:L1 number of sets128 setsL1 line size4 wordsL1 cache access time10 ns/lineL2 line size8 wordsL2 cache access t
10、ime20 ns/linemain memory access time70 ns/wordmain memory size256M wordsL1 cache hit rate95%L2 cache hit rate89%Label the fields of the memory address below used to access the L1 cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _19_ bits Index
11、 :_7_ bits Offset :_2_ bitsLabel the fields of the memory address below used to access the L2 cache and indicate the size of each field (in number of bits). Assume that memory is word-addressed.Tag : _25_bits Index : _0_bits Offset : _3_ bitsQuestion 11一個簡單的共享內存cache-coherent機有四個處理器,沒有"虛擬到物理&qu
12、ot;的翻譯和16位(物理)地址。每個處理器有一個L1數據緩存,沒有L2高速緩存。每個L1緩存是有四個64字節的塊(每個緩存的大小是256字節)的直接変換,他們使用MESI一致性協議來保持一致的。每個緩存的初始狀態(十六進制符號標記所示):P0P1P2P3statetagstatetagstatetagstatetagI0FS0FS01S01M01E02M03E04I0FI0FE0FI0FM00E02S04I06如果按順序執行下面的內存訪問,將會發生什么?特別是,指定每個其他的緩存發生在由于總線廣播、數據從哪里來(如果在緩存中沒有準備好),和新狀態塊的請求者的緩存。P0寫一個字到地址00 fc
13、P1讀一個字到地址0 f8c P2讀一個字到地址0 f8c P3寫一個字到地址0444 答案:P0P1P2P3statetagstatetagstatetagstatetagIOFSOFSOFSOFM01E02M03M04IOFIOFEOFIOFM00E02S04I06Question 13答案:A: P0 B0( S,120,00,20)B: P0 B0 (M,120,00,80) P1 B0 (I,120,00,20)C: P2 B0 (M,120,00,80) P0 B0 (I,120,00,80) P1 B0 (I,120,00,80)D: P1 B2 (S,110,00,30)P2
14、B2 (S,110,00,30) E: P0 B1 (M,108,00,48) P1 B1 (I,108,,0,08) P2 B1(I,108,00,08)F: P0 B2 (M,130,00,78) 1. 處理器中某功能部件占總應用程序執行時間的比例為40%,先將該功能部件改進(加速10倍),則整個應用程序的加速比為多少?( D )A. 1.4B. 2.5 C. 2.18D. 1.562. 在計算機系統設計中,比較好的方法是:( D )A.從上向下設計 B.從下向上設計C.從兩頭向中間設計 D.從中間開始向上、向下設計3. 對系統程序員不透明的是:( D )A. Cache存儲器B. 系列機
15、各檔不同的數據通路寬度C. 指令緩沖寄存器 D. 虛擬存儲器4. 系列機軟件應做到:( B )A.向前兼容,并向上兼容B.向后兼容,力爭向上兼容C.向前兼容,并向下兼容 D.向后兼容,力爭向下兼容5. 屬計算機系統結構考慮的應是( C )。A主存采用CMOS還是TTL B主存采用多體交叉還是單體C主存容量和編址方式 D主存頻寬的確定6. 最能確保提高虛擬存儲器訪問主存的命中率的改進途徑是( D )。A增大輔存容量 B采用FIFO替換算法并增大頁面C改用LRU替換算法并增大頁面 D改用LRU替換算法并增大頁面數7. 靜態流水線是指( C )。A只有一種功能的流水線 B功能不能改變的流水線C同時只
16、能完成一種功能的多功能流水線D可同時執行多種功能的流水線8. 假設用軟件方法在A計算機上實現B計算機的指令系統,則B稱為( C )。A仿真機B.宿主機C虛擬機D.目標機9. 計算機中優化使用的操作碼編碼方法是( D )。A.哈夫曼編碼 B.ASCII碼 C.BCD碼 D.擴展操作碼10. 在采用基準測試程序來測試評價機器的性能時,下列方法按照評價準確性遞增的順序排列是( B )。(1)實際的應用程序方法(2)核心程序方法(3)玩具基準測試程序(小測試程序)(4)綜合基準測試程序A:(1)(2)(3)(4)B:(2)(3)(4)(1)C:(3)(4)(1)(2)D:(4)(3)(2)(1)11.
17、 10. 在系統結構設計中,提高軟件功能實現的比例會( C )。A、提高解題速度 B、減少需要的存貯容量C、提高系統的靈活性 D、提高系統的性能價格比12. CPI是量化計算機性能的一個重要指標,關于CPI說法正確的是( C )A .CPI由計算機的結構決定B. CPI由運行在計算機系統上的應用程序決定C. CPI由計算機的結構和應用程序共同決定 D.CPI由計算機的時鐘周期決定13. 以下不屬于計算機性能公式的變量是( D )A. IC B. 時鐘周期 C. CPI D. MIPS14. 未曾實現的商業計算機結構類型是 ( C ) A. SISD B. SIMD C. MISD D. MIM
18、D15. 關于近10年CPU從單核轉向多核處理器的解釋正確的是 ( D )A. 指令級并行技術已經發展到極限 B. CPU的工作電壓很難再下降C. 提高時鐘頻率會帶來CPU的散熱極限問題 D. 上述理由全部正確16. 圖像處理器GPU屬于哪種結構( B )A. SISD B. SIMD C. MISD D. MIMD17. 以下不屬于Flynn體系結構類型的是( C )A. SISD B . SIMD C. SIMT D. MISD18. CPI是量化計算機性能的一個重要指標,關于CPI說法正確的是( B )A .CPI由計算機的結構決定B. CPI由運行在計算機系統上的應用程序決定 C. C
19、PI由計算機的結構和應用程序共同決定 D.CPI由計存儲器系統決定分析:CPI=TC/IC19. 與存儲器-存儲器結構指令集結構相比, 寄存器-寄存器結構( D ).A. CPI大 B. 完成同一個算法需要的指令數更少 C. 指令的功能更復雜 D. 固定長度的指令編碼方式20. 計算機系統的執行時間的通用公式為: CPUtime = y × 時鐘周期 × CPI, 此處y是 ( B )A. 程序執行的周期數B. 被執行的指令總數C. 包括訪問存缺失在內的指令平均執行時間D. 每個周期內執行的指令數21. RISC 與 CISC 不同處有 ( C ) A. RISC指令復雜
20、B. CISC 指令效率高C .RISC 指令數量少 D. 以上說法均錯誤22. 關于MIPS的指令集結構類型說法正確的是( A )A. 寄存器-寄存器B. 寄存器-存儲器 C. 存儲器-存儲器 D. 以上說法均錯23. 流水線技術可以( A )A. 提高吞吐率 B. 降低吞吐率C. 降低響應時間 D. 增加響應時間24. 流水線通過哪種方式提高系統的性能 ( C )A. 減少指令的響應時間 B. 消除指令相關C. 開發指令級的并行 D. 降低CACHE的缺失率25. 惡化流水線的處理器性能的原因是( D )A .流水線每級處理時間不同B.連續的指令間的相關C.流水線的結構相關D .以上全部正
21、確26. 流水線技術可以( D )A. 提高吞吐率和不改變響應時間B. 提高吞吐率和降低響應時間C. 降低吞吐率和降低響應時間D. 提高吞吐率和增加響應時間27. 在k級單流水線中執行n個任務,所消耗的時鐘周期數( A )A. k+n-1 B. nk+1 C. k D. 以上說法全部錯誤28. 關于靜態指令調度和指令動態調度說法錯誤的是( C )A. 編譯器相比于硬件有更多的時間處理復雜的調度算法B. 編譯器靜態調度的前提是假設指令間存在比時間更復雜的沖突C. 編譯器靜態調度需要比動態調度更多的關于沖突的精確歷史數據D. 以上說法都錯誤29. 保留站項在流水線的哪一級釋放( A )A. 寫結果
22、 B. 發射 C. 執行 D. 確認30. 使用獨立的指令CACHE和數據CACHE的理由是( D )A . 數據和指令存在在不同的存儲器。B. 每個核的指令不同但數據共享 C. 存儲器的方法模式不同D. 減少指令和數據訪存的沖突31. 關于全相聯CACHE說法正確的是 ( C )A. 等價于一個1組1路組相聯 CACHEB. 等價于一個多組1路組相聯CACHEC.等價于一個1組多路直接映像CACHED.等價于一個多組1路組直接映像CACHE32. 關于強制性不命中說法正確的是( A )A .塊第一次被訪存所以不在CACHE中. B. 程序執行過程中由于cache容量有限不能保存所有塊C. 因
23、為采用組相聯和直接映像所以發生沖突被替換掉D.以上說法全錯33. 在采用單流水線、順序執行和順序提交結果的處理器中,那種情況會導致數據冒險( C )A. 寫后寫 B.讀后寫 C.寫后讀 D. 讀后讀34. 為什么亂序執行的處理器采用順序方式提交指令執行結果?( D )A. 確保精確異常 B. 確保多CACHE的一致性C. 糾正和恢復分支預測錯誤的現場 D. A和C都正確35. 在塊替換策略中,采用替換最近很少使用方法的理由是( A )A. 充分利用了程序的時間和空間局部性原理B. 充分利用了程序的局部性原理C. 充分利用了程序的空間局部性原理D. 沒用充分利用了程序的時間和空間局部性原理36.
24、 在4路組相聯緩存中,一個新的塊的位置被映像到( C )A. 任何位置B. 塊地址與組數取余運算的結果選組號,然后固定在組中的固定位置C. 塊地址與組數取余運算的結果選組號,然后存放在組中的任何位置D. 以上說法都不對37. 關于最近20年內發生的事情說法正確的是( A )A. 處理器和存儲器性能都提高了,但是處理器提高更多。B. 存儲器性能提高但處理器沒有。C. 處理器和存儲器性能都提高了,但是存儲器提高更多。D. 處理器性能提高但存儲器沒有。38. 相比于寫直達發,寫回法的優勢在于?( A )A. 減少存儲器訪存次數 B. 減少不命中的開銷C.減少命中時間 D.降低缺失率39. 假設指令的
25、處理必須使用五個功能部件, 這五個部件的執行時間分別為 : 10 ns, 8 ns,10 ns,10 ns and 7 ns.如果使用流水線技術,流水線寄存器的時間開銷為1 ns ,采用流水線與非流水線的加速比為( A ) A. 4.1 B. 5 C. 4.5 D. 340. 下列說法錯誤是:( B )A. 分支預測轉移比預測分支不轉移困難,因為需要提前指導分支轉移目標指令的地址。B. 預測分支轉移和不轉移的準確率都為50%。C. 根據BTB可以在取指令前判斷該指令是否為分支指令。D. 流水線的深度會增加分支預測錯誤的開銷時間。41. 寄存器換名技術可以消除( D )A. 寫后寫冒險B. 讀后
26、寫冒險C. 寫后讀冒險D. A和C全部正確42. 以下說法錯誤的是( D )A. 第一級緩存的容量小于第二級緩存的容量B. 第一級緩存的響應時間小于第二級緩存的響應時間C. 第一級緩存的被訪問次數小于第二級緩存的訪問次數D. 第一級緩存和第二級緩存都采用相同的地址映像方法43. 假設指令的處理必須使用五個功能部件, 這五個部件的執行時間分別為 : 10 ns, 8 ns,10 ns,10 ns and 7 ns.如果使用流水線技術,流水線寄存器的時間開銷為1 ns ,采用流水線與非流水線的加速比為( A ) A. 4.1 B. 5 C. 4.5 D. 344. 為什么亂序執行的處理器采用順序方
27、式提交指令執行結果?( D )A. 確保精確異常B. 確保多CACHE的一致性C. 糾正和恢復分支預測錯誤的現場D. A和C都正確45. 在前瞻執行中,ROB中的項釋放處在那一級( C )A. 譯碼 B. 發射 C. 執行 D. 確認46. 以下說法正確的是? ( D )A. 直接映像 cache 與只有1個組多路組相聯CACHE等價B. 直接映像 cache 與只有1個組的全相聯CACHE等價C. 直接映像 cache 與只有1個組1路組相聯CACHE等價D. 以上說法都錯47. 下列哪種地址映像方式不適合使用位預測技術 ( D ) A. 全相聯 B. 4路組全相聯C. 8路組全相聯D. 直
28、接映像48. 在監聽協議中,那種情況下主存的信息不是最新的( C )A. 對共享狀態數據進行寫操作后的寫直達 cachesB. 寫回caches有數據被標記為獨享狀態C. 寫回 caches有數據被標記為修改狀態D. 寫回caches有數據被標記為共享狀態49. 下列哪種技術并沒用通過采用開發并行度方法提高系統的性能( B ) A. 增加流水線深度提高工作頻率 B. 采用小緩存減少訪存響應時間 C . 增加功能部件提高吞吐率D. 采用多核處理器50. 假設有一單級非流水線處理器其機器周期為5ns,如果采用4級流水線實現該處理器,其機器周期為2ns,后者與前者的加速比是( D )A. 3 B.
29、2.5 C. 2 D. 0.551. 流水線寄存器發射出一條加法指令,同時也沒收到氣泡和停頓信息停頓信號,此時在指令隊列的尾部存在一條XOR運算指令,則等待發射的是( A )A add B xor C 氣泡 D 停頓52. 對于以下代碼:Int sum=0;for (int j = 0; j <1000; j+)sum= sum+arri下列那個變量利用了程序的空間局部性原理( ) 和時間局部性原理( B )A. j B. sum C. elements of arr D.以上都不正確53. 在使用虛擬存儲系統中 ,應用程序所使用的地址是( D )A. 主存空間B. 物理地址C. 地址空
30、間D. 虛擬地址54. 某計算機的Cache-主存層次采用組相聯映象方式,塊大小為128字節,Cache容量為64塊,按4塊分組,主存容量為4096塊。那么主存地址共需 ( A ) 位。A.19B.18 C.20D.以上都不對55. 基本的MIPS整數流水線中,訪存地址的計算發生在流水線的第( C )段。A1 B2 C3 D456. RISC執行程序的速度比CISC要快的原因是( C )。A.RISC的指令系統中指令條數較少B.程序在RISC上編譯生成的目標程序較短。C.RISC的指令平均執行周期數較少。D.RISC只允許load和store指令訪存。57. 通過編譯器重新安排指令的執行順序以
31、減少流水的停頓方法,稱之為( D )。A線性流水線 B非線性流水線 C動態調度 D靜態調度判斷題1. A Distributed Memory Multiprocessor is also called a Symmetric Multiprocessor (SMP).分布式內存的多處理器也稱為對稱多處理器(SMP)。 ( T )2. Suppose we expect at least an 80X parallel speed up from 100 processors. At most 0.25% of the execution of the original program may
32、 be sequential (i.e., non-parallelizable).假設我們希望至少一個從80年80 x并行加速處理器。最多0.25%的原始程序的執行順序(即。non-parallelizable)。( T )3. Suppose a conditional branch alternates between taken and not taken every time it is executed. A one-bit BHT predictor is likely to have a misprediction rate of 100% on this branch.假設一
33、個條件分支之間的交替而不是采取每次執行時。一個一比特的二叔丁基對甲酚預測可能會對這個分支的錯誤預測率為100%。( T )4. Suppose a conditional branch is taken the first 1000 times it is executed, and not taken the second 1000 times. A one-bit BHT predictor is likely to have performance similar to a correlating branch predictor on this branch.假設條件分支被執行第一的1
34、000倍,而不是采取第二個1000次。一比特的二叔丁基對甲酚預測可能是性能類似于相關分支預測在這個分支。( F )5. In Tomasulo's algorithm with speculation, when a branch is mispredicted, the data written to memory and the register file as a result of that branch are rolled back to their previous values.與投機Tomasulo的算法,當一個分支預測錯誤,數據寫入內存和寄存器文件的分支被回滾到之前
35、的值。( T )6. A Single-Instruction-Multiple-Data (SIMD) model of computation is characterized by independent threads computing on private memories.單指令多數據(SIMD)計算模型計算的特點是獨立的線程在私人記憶。( T )7. A return address predictor is likely to mispredict when there is deep recursion.( F )深度遞歸的時候,返回地址預測相當于誤預測。8. Comput
36、er architecture design needs to provide support to compiler.計算機體系結構設計需要為編譯器提供支持。( T )9. In the MIPS Pipeling, 'Updating the PC' is completed in EX stage.在MIPS Pipeling,“更新電腦”是在前階段完成。( F )10. For forwarding you need only look at the data available in the MEM stage.轉發你只需要看數據在MEM階段。( F )11. In
37、the MIPS pipeline, both reading and writing the register file can be done during half a clock cycle period. In particular reading is done in the first half while writing is done in the second half.在MIPS管道,讀寫寄存器文件可以半個時鐘周期期間完成。在上半年完成特定的閱讀寫作是在下半年完成。( F )12. In Tomasulo's algorithm with speculation,
38、 instructions may complete out of order.與投機Tomasulo的算法,說明可能完成的訂單。( F )13. The reorder buffer enables precise exceptions and interrupts.重新排序緩沖區支持精確的異常和中斷。( T )14. Critical word first reduce the cache miss penalty.關鍵字首先減少緩存錯過點球。( T )15. The LRU (least-recently used) replacement policy works because pr
39、ograms exhibit temporal locality. LRU(最近最少使用)替代政策工作,因為項目展覽時間局部性。( T )16. A distributed shared memory (DSM) multiprocessor usually has non-uniform memory access.分布式共享內存(DSM)多處理器通常有非一致內存訪問。( T )17. Computer architecture is intend to cover three affects of hardware, organization and ISA.計算機體系結構是打算覆蓋硬件的
40、三個影響,組織和ISA。( T )18. Compared with memory-memory architecture, register-register architecture has higher CPI.與memory-memory架構相比,注冊登記體系結構具有較高的CPI。( F )19. For forwarding you need only look at the data available in the WB Stage.轉發你只需要看數據在白平衡階段。( F )20. Data hazard rise when an instruction depends on t
41、he results of a previous instruction in a way that is exposed by the overlapping of instructions in the pipeline.數據風險上升,當一個指令的結果依賴于前一個指令的方式公開的重疊在管道的指令。( T )21. Doubling the associativity of a cache without changing its overall capacity or block size will increase the tag size by one bit.翻倍的結合性緩存不改變其
42、整體能力或塊大小將增加標簽的大小。( T )22. The MIPS CPU has a RISC ISA. ( T )23. CPI is always a number greater than or equal to 1, because an instruction cant be executed in less than one cycle.CPI總是大于或等于1,因為一個指令不能被執行在不到一個周期。( F )24. Splitting the shortest stage of a five-stage pipeline will result in a higher cloc
43、k rate.分裂的最短階段五級管道將導致更高的時鐘頻率。( F )25. There are 3 types of pipeline hazards: structure, data, and control hazards.有3種管道危險:結構、數據和控制危害。( T )26. In Tomasulo's algorithm with speculation, when a branch is mispredicted , the data written to memory and the register file as a result of that branch are
44、rolled back to their previous values.與投機Tomasulo的算法,當一個分支預測錯誤,數據寫入內存和寄存器文件的分支被回滾到之前的值。( T )27. A two-bit predictor performs better than a single bit predictor even if the conditional branch is executed exactly once.低廉的預測性能優于單一位預測即使條件分支完全執行一次。( F )28. A direct-mapped cache of size N has the same miss
45、 rate as a 2-way set-associative cache of size N/2.direct-mapped緩存大小為N的缺頁率具有相同的雙向set-associative緩存的大小為N / 2。( T )29. A CISC architecture has a fixed instruction length.CISC體系結構有一個固定的指令長度。( F )30. Splitting the shortest stage of a five-stage pipeline will result in a higher clock rate.分裂的最短階段五級管道將導致更
46、高的時鐘頻率。( F )31. Data hazards are caused by hardware conflict. 數據危害是由硬件引起的沖突。( F )32. Merging write Buffer reduce the cache miss penalty.合并寫緩沖減少緩存錯過點球。( T )33. CPI is always a number greater than or equal to 1, because an instruction cant be executed in less than one cycle.CPI總是大于或等于1,因為一個指令不能被執行在不到一
47、個周期。( )34. Suppose a conditional branch alternates between taken and not taken every time it is executed. A one-bit BHT predictor is likely to have a misprediction rate of 100% on this branch.假設一個條件分支之間的交替而不是采取每次執行時。一個一比特的二叔丁基對甲酚預測可能會對這個分支的錯誤預測率為100%。( T )35. Register renaming eliminates stalls due
48、to flow (WAR) dependences on registers.寄存器重命名消除攤位由于流(戰爭)依賴性寄存器。( T )36. A dynamic branch predictor is always better than a static one.一個動態分支預測總是比靜態的好。( F )37. Translation look-aside buffers (TLBs) are caches that hold virtual address to physical address translations.轉換后援緩沖區(tlb)緩存,虛擬地址到物理地址的翻譯。( T )
49、簡答題(紅色為A卷試題)1、 RISC機器的設計原則答:指令條數少、指令功能簡單。確定指令系統時,只選取使用頻度很高的指令,在此基礎上補充一些最有用的指令(如支持操作系統和高級語言實現的指令);采用簡單而又統一的指令格式,并減少尋址方式,指令字長都為32位或64位;指令的執行在單周期內完成(采用流水線技術后);采用load-store結構,即只有load和store指令才能訪問存儲器,其他指令的操作都是在寄存器之間完成的;大多數指令都采用硬連接邏輯來實現;強調優化編譯器的作用,為高級語言程序生成優化的代碼;充分利用流水技術來提高性能。2、 MIPS機器五級流水線(哪五級,每級的功能)答:包括:
50、取指令(IF),指令譯碼/讀寄存器(ID),執行/有效地址計算(EX),存儲器訪問/分支完成(MEM),寫回(WB)。取指令(IF):以PC中的值作為地址從存儲器中取出一條指令,放入指令寄存器(IR);同時PC值加4,然后放入NPC;指令譯碼/讀寄存器(ID):對指令進行譯碼,并以指令中的rs和rt字段作為地址訪問通用寄存器組,把讀出的操作數分別放入A和B中。同時IR的低16位進行符號擴展,然后存入Imm。在這一級,ALU對在前一級準備好的操作數進行計算。存儲器訪問/分支完成(MEM):所有指令都要在該級進行更新。除了分支指令,其他指令都是做:PCNPC。在該級處理的指令只有load、stor
51、e和分支三種指令;寫回(WB):把在前面4級中得到的結果寫入通用寄存器組。3、 降低Cache命中時間的方法。(任意列出三種,并給出解釋)答:降低Cache的命中時間:采用容量小、結構簡單的Cache:硬件越簡單,速度就越快。應使Cache容量足夠小,以便可以與處理器做在同一芯片上,避免因片外訪問而增加時間開銷。還要保持Cache結構的簡單性,例如采用直接映像Cache,優點是可以讓標識檢測和數據傳送同時進行,從而有效減少命中時間;采用虛擬Cache:是指直接用虛擬地址進行訪問的Cache,其標識存儲器中存放的是虛擬地址,進行地址檢測用的也是虛擬地址。虛擬Cache的優點:在命中時不需要地址轉換,因而也就省去了地址轉換的時間。另外,即使不命中,地址轉換和訪問Cache也是并行進行的,其速度比物理Cache快很多。采用蹤跡Cache:蹤跡Cache中存放的是CPU所執行過的動態指令序列,其中包含了由分支預測展開了的指令。該分支預測是否正確需要在取到該指令時進行確認。能夠提高指令Cache的空間利用率,避免因分支成功發生跳轉處于該塊之后的指令用不到,跳轉到的塊的位置之前的指令用不到浪費空間。4、 什么是Cache的一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024四川長虹模塑科技有限公司招聘塑壓輔助工等崗位1084人筆試參考題庫附帶答案詳解
- 九年級數學下冊 第27章 圓27.2 與圓有關的位置關系3切線第2課時 切線長定理與三角形的內切圓教學設計 (新版)華東師大版
- 中考專題之勾畫隱圓,破解最值教學設計 2023-2024學年北師大版數學九年級下冊
- 2024四川省水電投資經營集團有限公司公開選聘所屬公司財務總監5人筆試參考題庫附帶答案詳解
- 專題03 情境補寫考點(教案)2025年新高考語文一輪復習考點滿分寶典 學案
- 九年級數學上冊 第23章 圖形的相似23.6 圖形與坐標 2圖形的交換與坐標教學設計 (新版)華東師大版
- 55018《計算機控制技術(第2版)》于海生版本教學大綱
- 化學九年級上冊第1節 構成物質的基本微粒教案設計
- 人教部編版七年級上冊第二單元 夏商周時期:早期國家的產生與社會變革第五課 青銅器與甲骨文教學設計
- 人教部編版七年級上冊第七課 戰國時期的社會變化教學設計
- 名著導讀 西游記
- 靜脈給藥錯誤演練腳本
- IE動作MOD法培訓資料
- 一汽解放維修手冊說明書
- 禽流感人流感人間禽流感培訓課件
- MT 191-1989煤礦井下用橡膠管安全性能檢驗規范
- JJF 1319-2011傅立葉變換紅外光譜儀校準規范
- GB/T 4857.4-2008包裝運輸包裝件基本試驗第4部分:采用壓力試驗機進行的抗壓和堆碼試驗方法
- GB/T 25174-2010飼料添加劑4,7-二羥基異黃酮
- GB/T 17421.2-2000機床檢驗通則第2部分:數控軸線的定位精度和重復定位精度的確定
- GB/T 17311-1998標準音量表
評論
0/150
提交評論