《TigerSHARC處理器技術及其應用》課件第1章

上傳人：1*** IP屬地：廣東上傳時間：2024-12-06 格式：PPT 頁數：51 大?。?46.50KB 積分：15 舉報 版權申訴

已閱讀5頁，還剩46頁未讀，繼續免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第1章概述1.1數字信號處理器的基本概念和特點1.2數字信號處理器的發展歷史和應用1.3ADI公司的DSP系列簡介1.1數字信號處理器的基本概念和特點

1.1.1數字信號處理器的基本概念

數字信號處理器(DigitalSignalProcessor，DSP)是一種專門用來實現各種數字信號處理算法的專用處理器，可以分成專用DSP和通用DSP兩類。專用DSP用來實現某些特定的數字信號處理功能，如數字濾波、FFT等。它不需要編程，使用方便，處理速度快，但是缺乏靈活性。通用DSP則有完整的指令系統，通過編程可實現各種復雜的數字信號處理功能，具有適應性強、靈活性高、應用范圍廣、開發成本低、開發周期短等顯著優點，得到了廣泛的應用。

通用DSP(以下簡稱DSP)實際上是一種專門針對數字信號處理應用而設計的專門的處理器。按照其指令系統可以分為定點處理器和浮點處理器。定點處理器算術邏輯單元(ALU)的運算針對定點數(整數或者小數)設計，一般可以直接進行定點數的運算，不能直接進行浮點數(實數)的運算。當利用定點處理器進行浮點數運算時，其運算時間會增加，從而導致運行效率急劇下降。而浮點處理器通常設計有專門的浮點數加法和乘法硬件運算單元，它既可進行浮點數的運算，也可進行定點數的運算，并且完成浮點數運算和定點數運算的時間或者指令周期數相同。因此，浮點處理器運算精度高，可以完成各種復雜的數字信號處理算法。

定點處理器DSP可以勝任大多數數字信號處理應用，但其可處理的數據的動態范圍有限，如16bit定點DSP的動態范圍僅96dB。在某些數據動態范圍很大的場合，按定點數處理可能會發生數據溢出，在編程時需要使用移位定標措施或者用定點指令模擬浮點數運算，使程序執行速度大大降低。浮點DSP的出現解決了這些問題，它拓展了數據動態范圍。浮點DSP的綜合性能優于定點DSP，在相同的指令周期內，它既可完成32位定點數運算，也可完成浮點數運算，而且其匯編源程序容易編寫，可讀性好，調試方便。

DSP主要用于滿足各類通信設備、雷達、數字電視、數碼照相機、數碼攝像機、DVD、VCD、音響設備等各種應用對數字信號處理的需要。DSP的特點之一是適合于數學計算密集的應用，如快速傅立葉變換(FFT)、卷積、相關、數字濾波、譜估計等數學計算密集類算法。DSP在其體系結構上采取了一系列措施，使其在數學計算方面具有優越的性能。DSP的另一個特點是運算速度快，可以實現實時計算，這在調制和解調、雷達信號檢測等應用中非常重要。1.1.2數字信號處理器的特點

1)運算單元

DSP具有硬件乘法器和多功能運算單元。硬件乘法器可以在單個指令周期內完成乘法操作，這是DSP區別于通用微處理器的一個重要標志。DSP的多功能運算單元可以完成加減、邏輯、移位、數據傳送等操作。新一代的DSP內部甚至還包含多個并行的運算單元，大大提高了運算和處理能力。

針對濾波、相關、矩陣運算等需要大量乘及累加運算的特點，DSP算術單元中的乘法器和加法器可以在一個時鐘周期內完成相乘、累加兩個運算。近年出現的許多DSP還可以同時進行乘、加、減運算，大大提高了完成FFT運算和數字濾波等典型數字信號處理算法的速度。

2)總線結構

傳統的通用處理器采用統一的程序和數據空間、共享的程序和數據總線結構，即所謂的馮·諾依曼結構。DSP普遍采用了數據總線和程序總線分離的多總線結構，即哈佛結構或者改進的哈佛結構，極大地提高了指令執行速度。片內的多套總線可以同時進行取指令和多個數據存取操作，許多DSP片內嵌有DMA控制器，配合片內多總線結構，可使數據塊傳送速度大大提高。如TI公司的C6000系列的DSP采用改進的哈佛結構，內部有一套256位寬度的程序總線、兩套32位的數據總線和一套32位的DMA總線。ADI公司的SHARC和TigerSHARC系列DSP采用超級哈佛結構(SuperHarvaredArchitectureComputer)，內部集成了3套甚至4套總線，即程序存儲器總線、數據存儲器總線和輸入輸出總線。

3)專用尋址單元

DSP面向數據密集型應用，伴隨著頻繁的數據訪問，數據地址的計算也需要大量時間。DSP內部配置了專用的尋址單元，用于地址的修改和更新，它們可以在尋址訪問前或訪問后自動修改內容，以指向下一個要訪問的地址。地址的修改和更新與算術單元并行工作，不需要額外的時間。

DSP的地址產生器支持直接尋址、間接尋址操作，大部分DSP還支持位反轉尋址(用于FFT算法的數據次序整理)和循環尋址(用于數字濾波算法)。

4)片內存儲器

針對數字信號處理的數據密集運算的需要，DSP對程序和數據訪問的時間要求很高，為了減小指令和數據的傳送時間，許多DSP內部集成了高速程序存儲器和數據存儲器，以提高程序和數據訪問存儲器的速度。

如TI公司的C6000系列的DSP內部集成有1～7MB的程序和數據RAM；ADI公司的SHARC系列的DSP內部集成有0.5～5MB的程序和數據RAM，TigerSHARC系列的DSP內部集成有6～24MB的程序和數據RAM。

5)流水處理技術

DSP大多采用流水技術，即將一條指令的執行過程分解成取指、譯碼、取數、執行等若干個階段，每個階段稱為一級流水。每條指令都由片內多個功能單元分別完成取指、譯碼、取數、執行等操作，從而在不提高時鐘頻率的條件下減少了每條指令的執行時間。

6)?DSP與其他處理器的差別

數字信號處理器(DSP)、通用微處理器(MPU)、微控制器(MCU)三者的區別在于：

●?DSP面向高性能、重復性、數值運算密集型的實時處理；

●?MPU大量應用于個人計算機；

●?MCU適用于以控制為主的處理過程。

DSP的運算速度要比其他處理器高得多，以FFT、相關為例，高性能DSP不僅處理速度是MPU的4～10倍，而且可以連續不斷地完成數據的實時輸入/輸出。DSP的結構相對單一，普遍采用匯編語言編程，其任務完成時間的可預測性相對于結構和指令復雜(超標量指令)且嚴重依賴于編譯系統的MPU強得多。以一個FIR濾波器的實現為例，每輸入一個數據，對應每階濾波器系數需要一次乘、一次加、一次取指、二次取數，還需要專門的數據移動操作。DSP可以單周期完成乘加并行操作以及2～4次數據存取操作，而普通MPU完成同樣的操作至少需要4個指令周期。因此，在相同的指令周期和片內指令緩存條件下，DSP的運算速度是MPU運算速度的4倍以上。

1.2數字信號處理器的發展歷史和應用

1.2.1數字信號處理器的發展歷史

世界上第一個單片DSP芯片是1978年AMI公司發布的S2811。1979年，美國Intel公司發布的商用可編程器件2920是DSP芯片發展史中的一個里程碑。1980年，日本NEC公司推出的μPD7720是第一個具有乘法器的商用DSP芯片。1.2.2數字信號處理器的應用

隨著DSP性能的迅速提高和成本的大幅度下降，DSP的應用范圍不斷擴大，其已成為當前產量和銷售量增長最快的電子產品之一。DSP應用幾乎遍及整個電子領域，常見的典型應用領域包括：

1)通用數字信號處理技術

通用數字信號處理技術是數字信號處理中最常使用的，包括數字濾波、卷積、相關、FFT、希爾伯特變換、自適應濾波、窗函數產生和波形發生等。

2)通信技術

數字信號處理器在通信技術中應用廣泛，如應用于高速調制解調器、編/譯碼器、自適應均衡器、程控交換機、蜂窩移動電話、數字基站等設備以及電視會議、保密通信、衛星通信等技術領域。隨著互聯網絡的迅猛發展，DSP又在網絡管理/服務、信息轉發、IP電話等新領域扮演著重要角色，而軟件無線電的提出和發展則進一步增強了DSP在無線通信領域的作用。

3)語音處理

語音處理是通信領域中最活躍的技術之一。數字信號處理器在語音識別、語音合成、矢量編碼、語音信箱中有著廣闊的應用。

4)圖形和圖像處理

圖形和圖像處理是數字信號處理器的重要應用領域之一，在三維圖像變換、模式識別、圖像增強、動畫處理、圖形顯示加速、電子出版、電子地圖等方面都有其用武之地。

5)自動控制

專用的數字信號處理器可以用于磁盤、光盤和打印機的伺服控制及發動機控制、電機驅動等技術領域。

6)儀器儀表

在測量數據譜分析、自動監測及分析、暫態分析、勘探、模擬試驗等儀器儀表中，數字信號處理器可以作為嵌入式處理器，提供更強的處理能力，提升儀器的性能。

7)醫用電子儀器

在醫用電子儀器如助聽器、CT掃描、超聲波、心腦電圖、核磁共振、醫療監護等領域，數字信號處理器也發揮著越來越大的作用。

8)軍事與尖端科技

數字信號處理器在雷達和聲納信號處理、雷達成像、自適應波束合成、陣列天線信號處理、導彈制導、火控系統、戰場C3I系統、導航、全球定位GPS、目標搜索跟蹤、尖端武器試驗、航空航天試驗、宇宙飛船、偵察衛星中有著廣泛的應用。

9)計算機與工作站

數字信號處理器在陣列處理機、計算加速卡、圖形加速卡、多媒體計算機中也得到了應用。

10)消費電子

在消費電子設備中，數字信號處理器作為嵌入式處理器得到了廣泛的應用，如數字電視、高清晰度電視、圖像/聲音壓縮解壓器、VCD/DVD/CD播放機、電子玩具、游戲機、數字留言/應答機、汽車電子裝置、音響合成、住宅電子安全系統和家電電腦控制裝置。

1.3ADI公司的DSP系列簡介

1.3.1Blackfin系列定點處理器

Blackfin系列定點處理器是高性能和低成本的嵌入式處理器，它針對嵌入式音頻、視頻和通信應用的計算和功耗要求設計，是一種新型16/32位嵌入式處理器。Blackfin處理器基于由ADI和Intel公司聯合開發的微信號架構(MSA)，將一個32位RISC型指令集和雙

16位乘法累加(MAC)信號處理功能與通用型微控制器所具有的易用性組合在了一起。這種處理特征的組合使得Blackfin處理器能夠在信號處理和控制處理應用中發揮上佳的作用，極大地簡化了硬件和軟件設計過程。

Blackfin系列處理器目前的最高內核時鐘頻率達到756MHz，提供了高達1512MMACS的運算能力，其相應的功耗低于0.15mW/MMAC(0.8V電源)。這類DSP綜合了高性能和低功耗的特點，并且具有豐富的接口資源，因此非常適合于嵌入式應用的場合，如無線寬帶網絡、移動通信、音頻和視頻處理、工業控制、車載設備、消費電子設備等。Blackfin系列處理器具有以下基本特點：

1)高性能處理器內核

Blackfin處理器內核采用了一個10級RISCMCU/DSP流水線，一個專為實現最佳代碼密度而設計的混合16/32位指令集。Blackfin處理器支持SIMD(單指令多數據)操作，并提供了加速視頻和圖像處理的指令。該架構很適合于信號處理/分析能力，還可在單內核器件或雙內核器件上提供高效RISCMCU控制任務執行能力。

2)高帶寬DMA能力

所有的Blackfin處理器均具有多個獨立的DMA控制器，這些控制器支持自動數據傳輸，而所需的處理器內核開銷極少。DMA傳輸可出現于內部存儲器和諸多具有DMA功能的外設之間，也有可能出現于外設和與外部存儲器接口相連的外部器件(包括SDRAM控制器和異步存儲器控制器)之間。

3)視頻指令

除了具有對8位數據以及許多像素處理算法所常用的字長的支持之外，Blackfin處理器還包括專為增強視頻處理應用中的性能而定義的指令。比如，離散余弦變換(DCT)通過一個IEEE1180舍入操作得到支持，而“SUMABSOLUTEDIFFERENCE”指令則支持在諸如MPEG2、MPEG4和JPEG等視頻壓縮算法中所使用的運動估計算法。

4)高效控制處理

Blackfin處理器提供了各種在RISC控制處理器中才具有的特性。這些特性包括：功能強大且靈活的分層存儲器架構、出眾的代碼密度以及各種外設接口，包括10/100以太網MAC、UART、SPI、CAN控制器、支持PWM的定時器、看門狗定時器、實時時鐘和一個無縫同步和異步存儲器控制器。所有這些特點為設計師提供了巨大的設計靈活性，并最大限度地降低了最終系統的成本。

5)分層存儲器

Blackfin處理器存儲器架構在器件實現中提供了L1和L2兩級存儲模塊。L1存儲器直接與處理器內核相連，以全系統時鐘頻率運行并為實時算法程序段提供了最大的系統性能。L2存儲器是一種大容量存儲模塊，其性能雖略有下降，但運行速度仍然高于片外存儲器。

6)易用性

如今，在許多過去需要同時采用一個高性能信號處理器和一個單獨的高效控制處理器的應用中，只需采用一個Blackfin處理器就足夠了。這種好處極大地縮減了開發時間和成本，并最終加快了產品的開發進程。

7)豐富的內嵌接口資源

Blackfin處理器提供了豐富的內嵌接口資源，包括各類串行接口如SPI、SPORTS、UART、I2S、CAN、USB等，并行接口如PFX、GPIO等，存儲器接口如SDRAM、SRAM、FLASH等，數字音頻接口，以太網接口等接口資源。

8)電源管理功能

Blackfin處理器為了減小功耗，提供了動態電源管理功能。它可以通過設置內核時鐘頻率工作在全速模式或者正常模式，還可以工作在休眠模式、深度休眠模式、冬眠模式、節能模式等工作模式。1.3.2SHARC系列DSP的基本特點

SHARC系列是采用超級哈佛結構(SuperHarvardArchitecture，SHARC)的32位浮點DSP。超級哈佛結構是指處理器內部擁有獨立的一套程序總線、兩套數據總線和一套IO總線。SHRAC系列的內核中設置了專門的算術邏輯單元(ALU)、乘法器和桶形移位寄存器，構成其基本處理模塊；設置了專門的數據/程序地址發生器和程序序列控制器，進行程序和數據地址的計算和產生。為了適應實時處理的要求，其內部集成了大容量存儲器和專用接口，可以簡化系統設計和降低研發成本。

SHARC系列DSP的共同技術特征包括：支持IEEE32/40位浮點格式數的運算(加、乘和乘累加)，具有32位定點乘法器和80位累加器，所有的運算都是單周期的，硬件設計支持循環尋指方式，支持6層循環嵌套，采用代數化匯編編程語言，提供了位操作、除法和開方指令。SHARC全系列在匯編語言級別是兼容的，它們有公共的指令集，可以在各種處理器之間共享。

SHARC系列DSP中的音頻處理系列，提供了豐富的專業的數字音頻接口，其片內的掩膜ROM包含了多聲道的音頻解碼器以及流水處理算法，支持多種音頻數據處理應用。SHARC系列DSP提供的音頻接口包括數字音頻接口(DigitalAudioInterface，DAI)、音頻解碼器(AudioDecoder)、S/PDIP兼容的音頻收發器、采樣速率轉換(SampleRateConvert，SRC)等。這些音頻接口通過其信號路由分配單元(SignalRoutingUnit，SRU)由用戶指定到可編程的IO引腳，并且支持多種音頻傳輸協議，可以簡化硬件設計，縮短產品開發周期，具有廣泛的應用前景。除了專門的音頻數據接口外，SHARC系列DSP還提供了常用的串行接口、并行接口以及高速鏈路口(LINK)。其中串行接口包括同步串行口(SPORT)、串行設備接口(SPI)、異步串行接口(UART)、2線串行接口(TWI)等，它們可以方便地與各種串行器件互連。其數字并行接口(DPI)中包含了通用輸入輸出(GPIO)功能和復用功能，高速LINK口可以實現處理器之間的高速數據傳輸。

SHARC系列支持多種DMA傳輸方式，包括內部存儲器與外部存儲器之間、存儲器與各種接口之間的數據傳送。它內部的DMA控制器可以與內核同時工作，大大節省了內核的運算時間，提高了運行效率。

SHARC系列DSP提供了極高的I/O數據吞吐率、功能優異的內核和大容量內部存儲器。它目前主要的應用方向包括家庭和汽車音響、醫用、儀器儀表、測試儀器等領域，為這些應用提供浮點處理的低成本解決方案。

目前SHARC系列DSP有4代產品。第一代產品為ADSP—2106X系列，采用單內核(包括ALU、乘法器、移位器和寄存器組)和單指令單數據(SISD)結構，具有66MHz/198MFLOPS的運算能力，可以完成32位定點或者32/40位浮點計算，其片內集成了大容量的高速存儲器。第一代產品包括ADSP—21060/061/062/065L等幾款芯片，具有6個8位高速鏈路口，可以十分方便地構成矩陣式并行多處理器系統，可以適應各種大運算量應用。

SHARC系列的第二代產品為ADSP—2116X系列，采用雙處理模塊(即兩套ALU、乘法器、移位器和寄存器組)和單指令多數據(SIMD)結構，具有100MHz/600MFLOPS的運算能力，提高了其處理能力和運算性能，其片內集成了大容量的存儲器，同時還提供了豐富的外部接口。

SHARC系列的第三代產品為ADSP—2126X和ADSP—2136X系列，仍然采用雙運算模塊和單指令多數據(SIMD)結構，具有高達400MHz/2400MFLOPS的運算能力，保持了前兩代的特點，提高了其處理能力。為了擴展其用途，片內集成了各種接口，包括多通道音頻解碼器、S/PDIF收發器、異步采樣速率轉換、PWM通道、代碼加密等專用接口資源，可以適應大多數音頻信號處理應用。為了降低成本和減小引腳數目，第三代產品的外部地址和數據總線引腳采用復用方式，并且其大部分產品的引腳是兼容的。

SHARC系列的第四代產品為ADSP—2146X系列，仍然采用雙處理模塊和單指令多數據(SIMD)結構，具有高達450MHz/2700MFLOPS的運算能力，并且附加了專門的硬件FIR濾波器加速邏輯，內部RAM最高達5Mb，提高了其處理能力。其片內集成了各種接口，包括串行接口、SPI接口、多通道音頻解碼器、S/PDIF收發器、多通道異步采樣速率轉換、代碼加密等專用接口資源，可以適應大多數音頻信號處理應用。它們也具有2個8位高速鏈路口，也可以十分方便地構成并行多處理器系統，以適應各種大運算量的應用。1.3.3TigerSHARC系列DSP的特點

1)指令并行性和SIMD操作

作為一款靜態超標量DSP，TS系列處理器內核在單個指令行中能夠同時執行1～4條32位的指令碼。除少數情況外，無論一個指令行包含1條、2條、3條還是4條32位指令，其執行都將以一個周期完成。

TS系列處理器還通過并行使用兩個運算模塊以及SIMD專用計算而擁有了對單指令、多數據SIMD運算提供支持的能力。編程人員可以命令兩個運算模塊用相同的數據(廣播分發)或不同的數據(合并分發)來操作。此外，每個運算模塊還能夠并行執行4項16位計算或8項8位SIMD計算。

2)獨立和并行運算模塊

TS系列處理器具有兩個運算模塊，這兩個模塊可以獨立操作、并行操作，也可以作為一個SIMD引擎來操作。DSP在每個運算模塊、每個周期中能夠發出多達兩條計算指令，用于指示ALU、乘法器或移位器執行單獨而同時的操作。每個運算模塊包含4個計算單元、一個ALU、一個乘法器、一個64位移位器、一個CLU(僅ADSP—TS201S有)和一個32位寄存器文件。該32位字、多端口寄存器文件用來在計算單元和數據總線之間傳輸數據并存儲中間結果。指令能夠對寄存器文件中的寄存器進行單獨存取(字對齊)、兩個一組的存取(雙字對齊)或四個一組的存取(四字對齊)。ALU以定點和浮點格式來執行一組標準的算術運算，并同時執行邏輯運算。乘法器執行定點和浮點的乘法運算以及定點的乘法-累加運算。64位移位器執行邏輯和算術移位、位和位流處理以及位域存放和提取。

3)整數ALU

TS系列處理器具有兩個整數ALU(IALU)，它們提供強大的地址產生能力，并執行各種通用的整數運算。每個IALU具有一個多端口32字寄存器文件。作為地址生成器，這些IALU可執行直接或間接(提前和滯后修改)尋址。IALU可以執行模運算和位反序運算，且未對用于數據緩沖器布局的存儲器地址加以約束。每個IALU都可指定從存儲器進行單、雙或四字存取。

TS系列處理器IALU支持循環尋址操作的循環緩沖器，循環尋址方式為數字信號處理中經常出現的如濾波、相關、卷積、FFT等提供了高效的編程手段。每個IALU提供了用于4個循環緩沖器的寄存器，因此在應用中總共能夠設立8個循環緩沖器。IALU能夠自動處理地址指針回繞，因而減少了開銷，提高了性能并簡化了編程過程。

4)程序控制器

TS系列處理器的程序控制器通過向存儲器提供地址的方法來管理程序結構和程序流程。包含于程序控制器之內的指令對齊緩沖器(IAB)存儲了多達5個等待執行的讀取指令行。該程序控制器從IAB中抽取一個指令行，并將其分配至適當的內核元件以便執行。程序控制器的其他功能包括：根據諸如JUMP、CALL、RTI和RTS等指令來決定流程、遞減循環計數器、處理硬件中斷，并采用分支預測和128入口的分支目標緩沖器(BTB)來縮短分支延時，以有效實現條件和無條件跳轉指令的有效執行。

5)?DMA控制器

具有14個DMA通道的TS處理器片上DMA控制器可在無需處理器內核干預的情況下實現零開銷數據傳輸。DMA控制器能單獨工作，且不為DSP內核所察覺，從而使得DMA操作能夠在內核繼續執行程序指令的同時正常進行。

6)鏈路口

ADSP—TS20XS具有4個全雙工鏈路口，采用低

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

《TigerSHARC處理器技術及其應用》課件第1章

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

《TigerSHARC處理器技術及其應用》課件第1章

文檔簡介

溫馨提示

最新文檔

評論

相關文檔