




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
聲音:原理、采集及處理聲音簡介什么是聲音聲音是通過一定介質(如空氣、水等)傳播的連續的波聲音的重要性聲音是攜帶信息的極其重要的媒體,是多媒體技術研究中的一個重要內容聲音的種類繁多,如人的話音、樂器聲、動物發出的聲音、機器產生的聲音以及自然界的雷聲、風聲、雨聲、閃電聲等這些聲音有許多共同的特性,也有它們各自的特性。在用計算機處理這些聲音時,既要考慮它們的共性,又要利用它們各自的特性聲音的物理和心理特征物理特性心理/生理感覺特性頻率(Hz)音調,音高振幅/能量(W,mW)音量,響度波形音色頻率和振幅聲音信號的兩個基本參數:頻率和振幅信號的頻率:指信號每秒鐘變化的次數,用Hz表示。例如,大氣壓的變化周期很長,以小時或天數計算,一般人不容易感到這種氣壓信號的變化,更聽不到這種變化。對于頻率為幾Hz到20Hz的空氣壓力信號,人們也聽不到,如果它的強度足夠大,也許可以感覺到。音色聲音的波形絕大多數都不是簡單的正弦波,而是一種復雜的波。分析表明這
種復雜的波形,可以分解為一系列的正弦波,這些正弦波中有基頻f0,還有與f0成
整數倍關系的諧波:f1、f2、f3、f4,它們的振幅有特定的比例。這種比例,賦予每種樂器以特有的“色彩”—音色。如果沒有諧波成分,單純的基音正弦信號是毫無音樂感的。比如:大提琴音色、黑管音色不同聲音特性連續性時間和幅度上都是連續的聲波具有普通波所具有的特性反射(reflection)折射(refraction)衍射(diffraction)按照頻率分類次音信號(Infrasonic):頻率小于20Hz的信號可聽音(Audio)信號:頻率范圍為20Hz~20kHz的信號超聲波(Ultrasonic)信號:頻率高于20kHz的信號。具有很強的方向性,形成波束。在工業上得到廣泛的應用,如超聲波探測儀,超聲波焊接設備等音頻Audio音頻中 話音(speech)信號:頻率范圍為300~3400Hz的信號全頻帶聲音:20-20kHzMusic/Noise在多媒體技術中,處理的信號主要是Audio信號,包括音樂、話音、風聲、雨聲、鳥叫聲、機器聲等
人的聽力人耳對中頻段1~3千赫的聲音最為靈敏,對高、低頻段的聲音,特別是低頻段的聲音則比較遲鈍利用這些特性可以在壓縮音頻數據時區分對待按照存儲方式分類波形聲音(存儲的是波形)語音音樂效果聲合成聲音(存儲的是命令)MIDI聲音信號數字化從模擬過渡到數字數字信號優點精確運算容易可編程模擬信號與數字信號話音信號是典型的連續信號,不僅在時間上是連續的,而且在幅度上也是連續的時間上“連續”:指在一個指定的時間范圍里聲音信號的幅值有無窮多個幅度上“連續”:指幅度的數值有無窮多個模擬信號:在時間和幅度上都是連續的信號數字信號采樣(sampling):在某些特定時刻對模擬信號進行測量。離散時間信號:由這些特定時刻采樣得到的信號。
離散幅度信號:采樣得到的幅值是無窮多個實數值中的一個,因此幅度還是連續的。如果把信號幅度取值的數目加以限定,這種由有限個數值組成的信號就稱為離散幅度信號。【例】假設輸入電壓的范圍是0.0V~0.7V,并假設它的取值只限定在0、0.1、0.2,…,0.7共8個值。如果采樣得到的幅度值是0.123V,它的取值就應算作0.1V,如果采樣得到的幅度值是0.26V,它的取值就算作0.3,這種數值就稱為離散數值。數字信號:時間和幅度都用離散數字表示的信號。16聲音信號數字化數字化:采樣+量化,聲音進入計算機的第一步處理編碼:壓縮量化后的數據量
模擬聲音信號量化數字聲音01100011001···編碼采樣采樣采樣:連續時間的離散化。若每隔相等的一小段時間采樣一次,稱為均勻采樣(uniformsampling)采樣點采樣采樣頻率(fs):決定每秒鐘需要采集多少個聲音樣本奈奎斯特定理:采樣頻率不應低于聲音信號最高頻率的兩倍,這樣就能把以數字表達的聲音還原成原來的聲音,這叫做無損數字化(losslessdigitization)采樣定律采樣fs≥2f或者Ts≤T/2,其中f為被采樣信號的最高頻率。理解奈奎斯特理論:聲音信號可以看成由許許多多正弦波組成的,一個振幅為A、頻率為f的正弦波至少需要兩個采樣樣本表示,因此,如果一個信號中的最高頻率為fmax,采樣頻率最低要選擇2fmax。例如,電話話音的信號頻率約為3.4kHz,采樣頻率就選為8kHz。量化量化(quantization):連續幅度的離散化,就是把信號的強度劃分成一小段一小段。如果幅度的劃分是等間隔的,就稱為線性量化,否則就稱為非線性量化。量化精度每個采樣點樣本大小是用每個聲音樣本的位數bit表示的,它反映度量聲音波形幅度的精度。量化精度既決定了取樣值的動態范圍,也決定著所引入的噪聲大小。例如,每個聲音樣本用16位(2字節)表示,測得的聲音樣本值是在0~65536的范圍里,它的精度就是輸入信號的1/65536。樣本位數的大小影響到聲音的質量,位數越多,聲音的質量越高,而需要的存儲空間也越多;位數越少,聲音的質量越低,需要的存儲空間越少。信號噪聲比采樣精度的另一種表示方法是信號噪聲比,簡稱為信噪比(signal-to-noiseratio,SNR),并用下式計算:
SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise)Vsignal表示信號電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db)【例1】假設Vnoise=1,采樣精度為1位表示Vsignal=21,它的信噪比SNR=6分貝。【例2】假設Vnoise=1,采樣精度為16位表示Vsignal=216,它的信噪比SNR=96分貝。聲音的質量根據聲音的頻帶,通常把聲音的質量分成5個等級,由低到高分別是:電話(telephone)調幅(amplitudemodulation,AM)廣播調頻(frequencymodulation,FM)廣播激光唱盤(CD-Audio)數字錄音帶(digitalaudiotape,DAT)的聲音聲音質量的度量用聲音信號帶寬來衡量聲音的質量:等級由高到低依次是DAT,CD,FM,AM和數字電話。聲音客觀質量度量:信噪比(signaltonoiseratio,SNR),峰值信噪比PSNR。主觀度量聲音質量:召集若干實驗者,由他們對聲音質量的好壞進行評分,求出平均值作為對聲音質量的評價。這種方法稱為主觀平均判分法,所得的分數稱為主觀平均(meanopinionscore,MOS)分,比較通用的標準是5分制。(類似于評委打分)MOS表
聲音質量評分標準分數質量級別失真級別5優(Excellent)無察覺4良(Good)(剛)察覺但不討厭3中(Fair)(察覺)有點討厭2差(Poor)討厭但不反感1劣(Bad)極討厭(令人反感)聲音質量和數據率表
聲音質量和數據率質量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數據率(kB/s)(未壓縮)頻率范圍電話88單道聲8200~3400HzAM11.0258單道聲11.020~15000HzFM22.05016立體聲88.250~7000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.020~20000Hz聲音質量和數據率數據率=取樣頻率*量化位數*通道數目例:電話語音=8k*8b*1=64kbps=8kB/s=28MB/h
例:CD的數據率44.1KHz,16bits,228常見的聲音文件擴展名文件的擴展名說明AuSun和NeXT公司的聲音文件存儲格式(8位m律編碼或者16位線性編碼)aif(AudioInterchange)Apple計算機上的聲音文件存儲格式cmf(CreativeMusicFormat)聲霸(SB)卡帶的MIDI文件存儲格式MctMIDI文件存儲格式mff(MIDIFilesFormat)MIDI文件存儲格式mid(MIDI)Windows的MIDI文件存儲格式Mp2MPEGLayerI,IIMp3MPEGLayerIIImod(Module)MIDI文件存儲格式rm(RealMedia)RealNetworks公司的流放式聲音文件格式表
常見的聲音文件擴展名常見的聲音文件擴展名ra(RealAudio)RealNetworks公司的流放式聲音文件格式RolAdlib聲音卡文件存儲格式snd(sound)Apple計算機上的聲音文件存儲格式SeqMIDI文件存儲格式SngMIDI文件存儲格式voc(CreativeVoice)聲霸卡存儲的聲音文件存儲格式wav(Waveform)*Windows采用的波形聲音文件存儲格式WrkCakewalkPro軟件采用的MIDI文件存儲格式*支持PCM,ADPCM,m率和A率波形聲音工具聲音工具(audiotools)用來錄放、編輯和分析聲音文件,聲音工具使用相當普遍,但功能相差很大。Windows本身帶的“SoundRecorder”聲音工具聲卡自帶工具:聲卡一般都附帶有聲音工具。例如,聲霸(SoundBlaster)卡帶有幾種聲音工具,通常要由用戶自己安裝。其中,功能比較強的是WaveStudio,用戶界面如圖所示。
聲音工具網絡上下載的工具:因特網上有許多站點提供試用的或者是免費的聲音工具。圖所示的是CoolEdit工具,它很受聲音研究工作者的歡迎,還有goldwave公司的聲音工具,Cakewalk,Cubase等。電子樂器數字接口(MIDI)系統MIDI簡介
MIDI(MusicalInstrumentDigitalInterface)電子樂器數字接口,是在音樂合成器(musicsynthesizers)、樂器(musicalinstruments)和計算機之間交換音樂信息的一種標準協議。
MIDI是樂器和計算機使用的標準語言,是一套指令(即命令的約定),它指示樂器即MIDI設備要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是發給MIDI設備或其它裝置讓它產生聲音或執行某個動作的指令。MIDI標準的優點生成的文件比較小,因為MIDI文件存儲的是命令,而不是聲音波形容易編輯,因為編輯命令比編輯聲音波形要容易得多可以作背景音樂,因為MIDI音樂可以和其它的媒體,如數字電視、圖形、動畫、話音等一起播放,這樣可以加強演示效果產生MIDI樂音的方法兩種方法FM(frequencymodulation)合成法樂音樣本合成法,也稱為波形表(Wavetable)合成法FM合成聲音早期,音樂合成器的先驅RobertMoog采用模擬電子器件生成復雜樂音。20世紀80年代初,美國斯坦福大學(StanfordUniversity)一名叫JohnChowning的研究生發明了一種產生樂音的新方法,稱為數字式頻率調制合成法(digitalfrequencymodulationsynthesis),簡稱為FM合成器。把幾種樂音的波形用數字來表達,并且用數字計算機而不是用模擬電子器件把它們組合起來,通過數模轉換器(digitaltoanalogconvertor,DAC)來生成樂音。工作原理通過組合各種波形參數生成樂音斯坦福大學得到了發明專利,并且把專利權授給Yamaha公司,該公司把這種技術做在集成電路芯片里,成了世界市場上的熱門產品。FM合成法的發明使合成音樂工業發生了一次革命。樂音樣本合成聲音樂音樣本的采集:音樂家在真實樂器上演奏不同的音符,選擇44.1kHz的采樣頻率、16位的樂音樣本,這相當于CD-DA的質量,把不同音符的真實聲音記錄下來。樂音樣本通常放在ROM芯片上,ROM是超大規模集成電路(verylargescaleintegrated,VLSI)芯片。樂音樣本合成器所需要的輸入控制參數比較少,可控的數字音效也不多,產生的聲音質量比FM合成方法產生的聲音質量要高。MIDI系統PC機使用內置的MIDI接口卡,用來把MIDI數據發送到外部的多音色MIDI合成器模塊。語音合成(Speechsynthesis)語音合成:利用適當的方法和手段,從文本、概念或意向通過合成產生語音的過程。語音合成的3個層次:從文本到語音的合成(Text-to-Speech,簡稱TTS)從概念到語音的合成(Concept-to-Speech)從意向到語音的合成(Intention-to-Speech)這三個層次反映了人類大腦中形成說話內容的不同過程,涉及人類大腦的高級神經活動文語轉換的要求對合成語音的要求:可理解自然低延遲語速可變聲音可變語言可變應用:聲訊服務,自動應答,有聲電子郵件,殘疾人服務,自動配音等.42文本分析與理解文本韻律控制語音生成合成語音一串語音基元語音基元庫文本到發音的轉換發音標注發音規則庫韻律分析韻律控制參數韻律規則庫查找拼寫錯誤,對不規范或無法發音的字符進行過濾。分析文本中詞或短語的邊界,分析文本中的數字、姓氏、特殊字符、專有詞語等有關詞語讀音的性質。根據文本的結構、組成和標點符號,確定發音時語氣的變換以及不同音的輕重方式。分析并決定各個音節的聲調、語氣和停頓方式,發音的輕重、長短等文語轉換過程幾個TTS系統中國科大訊飛TTS系統
/微軟亞洲研究院的木蘭系統
/speech/tts/TTS.asp貝爾實驗室
/project/tts/mandarin.htmlIBM的ViaVoice數字圖像簡介圖象數據的獲取
圖象分為靜止的圖象(通常稱圖象)和活動的視頻靜止圖象通常是以位映射方法來表示每一點的數據矩陣,許多位圖均為24位,它可表達上百萬種顏色(224)靜止圖象的編輯軟件常見有Photoshop、ColorIt、Photostyler、PicturePublisher等工具軟件繪圖軟件有許多地方類似,但在畫質上較為講究,功能也較多些增加的功能包括顏色的選擇,如15位或24位顏色深度,并增加了光源、調色等功能
圖象數據視頻是由光線照射在物體上面,反映在照相機或攝象機鏡頭上,這種反射的光便形成電子信號信號可分3種顏色的合成,即RGB三色圖象保存在影片上或計算機的存儲器上時,便是以幀來組織的,一般一秒之內可以形成24至30幀,幀越多畫質與圖象的轉變愈平滑國際視頻標準
NTSC美國研制,是目前廣泛使用的電視制式以525條橫掃描線來組成一個屏幕幀,每秒30幀,其圖象的改變采用偶數線與奇數線相互交錯更新的方式,造成視覺動態圖象PAL中國、英國等國采用W.Bruch于1963年發明的,其基本原理類似于NTSC制式。它以625條掃描線,每秒25幀,也是以奇偶數掃描線交錯方式造成動態圖象國際視頻標準SECAM
法國、俄羅斯等國采用SECAM視頻同樣采用625條線和25幀,但與NTSC和PAL制式相比,其基礎的技術是采用頻率調制,傳播的方式也不同于以上兩種圖象處理軟件Photostyler是美國U-Lead公司開發的真彩色和灰度圖象編輯軟件,是用戶制作處理靜止圖象常常使用的軟件特點:可完成簡單的亮度和色彩校正以及復雜的圖象編輯,例如圖象掃描、校色、濾色、潤色、混色、特殊效果及顏色分離支持大量的流行的圖象文件格式,如TIFF、TGA、PCX、GIF、BMP等格式,并很容易文件格式轉換支持RGB、CMYK、HLS多種彩色模式及灰度圖象Photostyler的功能
(1)掃描圖象(2)選擇和蒙片(3)圖象編輯、轉換和特殊效果(4)圖象合成(5)圖象校正和加強(6)繪圖和潤色工具(7)圖象處理過濾器(8)顏色分離打印數字化表示傳統上用模擬方式表示聲音和圖象信息易出故障,常產生噪音和信號丟失,且拷貝過程中噪音和誤差逐步積累模擬信號不適合數字計算機加工處理數字化處理:巨大的數據量采樣采樣定理:僅當采樣頻率≥2倍的原始信號頻率時,才能保證采樣后信號可被保真地恢復為原始信號采用8bit數字化,從而1秒鐘電視信號的數據量約為99.2Mbits,即約為100Mbps650MB的CD-ROM僅能存約1分鐘的原始電視數據。若HDTV(1.2Gbps),一張CD-ROM還存不下6秒鐘的HDTV圖象采樣人說話的音頻一般在20Hz到4KHz,即人類語音的帶寬為4KHz依據采樣定理,設數字化精度為8b,則1秒鐘信號量為64Kbits,人講1分鐘話的數據量為480KB數字化處理的關鍵問題-數據壓縮壓縮的基礎-數據冗余
空間冗余
時間冗余
信息熵冗余結構冗余
知識冗余
視覺冗余
其它冗余
這是靜態圖像中存在的最主要的一種數據冗余在同一幅圖像中,規則物體和規則背景的表面物理特性具有相關性即對同一景物表面上采樣點的顏色之間存在著空間連貫性例如:圖像中一片連續的區域,其像素為相同的顏色,空間冗余產生空間冗余序列圖像(電視圖像、動畫)和語音數據中所經常包含的冗余一組連續的畫面之間往往存在著時間和空間的相關性例如:唱歌的歌手時間冗余信息熵冗余信息熵是指一組數據所攜帶的信息量,它定義為:H=-∑i=0N-1Pilog2PiN為數據類數或碼元個數,Pi為碼元yi發生的概率.為使信息編碼單位數據量d接近于或等于H,應設:d=∑i=0N-1Pib(yi)b(yi)是分配給碼元yi的比特數,理論上應取b(yi)=-log2Pi.實際一般取b(y0)=b(y1)=…=b(yK-1)例如,英文字母編碼碼元長為7bit,即b(y0)=b(y1)=…=b(yK-1)=7,這樣d必然大于H,由此帶來的冗余稱為信息熵冗余或編碼冗余
在某些場景中,存在著明顯的分布模式——結構結構可以通過特定的過程來生成例如:方格狀的地板,蜂窩,磚墻等結構冗余有許多圖像的理解與某些基礎知識有相當大的相關性這類規律性的結構可以由先驗知識和背景知識得到例如:人臉的圖像知識冗余可以根據這些視覺特性來對圖象信息進行取舍人類的視覺系統對圖像場的敏感性:非均勻和非線性的對亮度變化敏感,而對色度的變化相對不敏感在高亮度區,人眼對亮度變化敏感度下降對物體邊緣敏感,內部區域相對不敏感對整體結構敏感,而對內部細節相對不敏感視覺冗余彩色空間常見模型:
RGB彩色空間
HSI彩色空間
YUV彩色空間
YIQ彩色空間RGB彩色空間R,G,B分別代表紅(red)、綠(green)、藍(blue)三色。這是彩色最基本的表示模型通過對R、G、B三個顏色通道的變化以及它們相互之間的疊加可得到各式各樣的顏色RGB彩色空間
RGB是計算機系統使用的彩色模型顯示器可顯示256*256*256=16,777,216種顏色,即24位真彩(TrueColor)
常用的有RGB5:5:5方式和RGB8:8:8方式
RGB5:5:5方式中,用兩個字節表示一個像素RGB8:8:8方式中,R、G、B三個分量各占一個字節(8位)HSI彩色空間這種模型中,用H(Hue,色調)、S(Saturation,飽和度)、I(Intensity,光強度)3個分量來表示一種顏色,這種表示更適合人的視覺特性。顏色編輯器方形區域為色度圖,可對色度進行調節(包括色調和飽和度)色調值0~2392400亮度0~240飽和度從到條形區域為亮度圖,可調節亮度顏色編輯器YUV彩色空間Y為亮度信號,U、V是色差信號(B-Y,R-Y)
PAL制式彩色空間即為YUV。優點是亮度和色差信號分離,容易使彩色電視系統與黑白電視信號兼容國際無線電咨詢委員會根據實驗認為采用雙倍度采樣4:2:2方案效果較好,提出CCIR601標準變換公式(YUV<--->RGB)Y=0.299*R+0.587*G+0.114*BU=-0.169*R-0.332*G+0.500*BV=0.500*R+0.419*G-0.081*BYIQ彩色空間廣播電視系統另一種常用的亮度與色差分離的模型NTSC制式彩色空間即為YIQY是亮度,I和Q共同描述圖象的色調和飽和度。變換公式(YIQ<--->RGB)Y=0.299*R+0.587*G+0.114*BI=0.211*R-0.523*G+0.312*BQ=0.596*R-0.275*G-0.322*B數字圖象文件格式
TIFPCXGIF、TGA、BMP、DVI、JPEG等
TIF文件格式由美國AldusDeveloper’sDesk和Microsoft制定結構文件頭(8B)參數指針表
參數數據表
圖象數據
文件頭含字節順序(2B,表示存貯格式:II-Intel格式;MM—Motorola格式)標記號(2B,版本信息)指向第一個參數指針表的編碼(4B)參數指針表由每個長為12B參數塊構成,描述壓縮種類、長寬、彩色數、掃描密度等參數較長參數(如調色板)只給出指針,參數放在參數數據表中。其結構定義如下TIF文件格式
typedefstruct{inttag-type;intnumber-size;longlength;longoffset;}TIF-FIELD;TIF文件格式PCX文件格式由ZSoft公司最初制定結構文件頭(128字節)數據部分(采用行程長度編碼)
文件頭結構定義
typedefstruct{charmanufacture;/*always0xa0*/charversion;charencoding;/*always1*/charbits-per-pixel;/*colorbits*/intXmin,Ymin;/*imageorigin*/intXmax,Ymax;/*imagedimension*/inthres;/*resolutionvalues*/intvres;charpalette[48];/*colorpalette*/charreserved;charcolor-planes;/*colorplanes*/intbytes-per-line;/*linebuffersize*/intpalette-type;/*greyorcolorpalette*/charfiller[58];}PCXHEAD;PCX文件格式其中Version若為5,文件內有個256色調色板,數據768字節,在文件最后
文件體對像素數據采用行程長度編碼,由包含Keybyte和Databyte的包組成分2種情況:若Keybyte最高位為11,則低6位為重復次數(Index),即后一個字節重復使用Index次。但最多重復63次,若再長重建一個包若Keybyte最高位不是11,那么該Databyte按原樣寫入圖象文件。對一個字符的表示用長度為1的包11IndexDatabytePCX文件格式111Databyte常用的數據壓縮技術
根據解碼后數據與原始數據是否完全一致,數據壓縮方法劃分為兩類:可逆編碼(無失真編碼)解碼圖象與原始圖象嚴格相同,壓縮大約在2:1到5:1之間。如Huffman編碼、算術編碼、行程長度編碼等。不可逆編碼(有失真編碼)還原圖象與原始圖象存在一定的誤差,但視覺效果一般可以接受,壓縮比可以從幾倍到上百倍來調節。常用的有變換編碼和預測編碼
根據壓縮的原理可以有以下分類:預測編碼利用空間中相鄰數據的相關性來預測未來點的數據。差分脈沖編碼調制(DPCM)和自適應差分脈沖編碼調制(ADPCM)。變換編碼將圖象時域信號變換到頻域空間上處理。時域空間有強相關的信號,反映在頻域上是某些特定的區域內能量常被集中在一起,從而實現壓縮.正交變換如離散余弦變換,離散付立葉變換和Walsh-Hadamard變換.量化與向量量化編碼為了使整體量化失真最小,就必須依照統計的概率分布設計最優的量化器。已知最優量化器是Max量化器。對象元點進行量化時,也可以考慮一次量化多個點的向量量化。
常用的數據壓縮技術
信息熵編碼根據信息熵原理,讓出現概率大的用短的碼字表達,反之用長的碼字表示。最常見的方法如Huffman編碼、Shannon編碼以及算術編碼子帶編碼將圖象數據變換到頻域后,按頻域分帶,然后用不同的量化器進行量化,從而達到最優的組合。或者分步漸近編碼,隨著解碼數據的增加,圖象逐漸清晰模型編碼編碼時首先將圖象中邊界、輪廓、紋理等結構特征找出來,保存這些參數信息。解碼時根據結構和參數信息進行合成,恢復出原圖象。具體方法有輪廓編碼、域分割編碼、分析合成編碼、識別合成編碼、基于知識的編碼、分形編碼等常用的數據壓縮技術
PhotoshopPhotoshop工具箱中存放著各種編輯工具,使用方便控制面板的主要作用是輔助工具欄,更改工具的設置,一些對圖層、通道、歷史紀錄的操作也要在此完成在菜單欄里的窗口選項中可以設置此欄中各項的顯示與否,也可用鼠標拖動控制面板中的選項,按自己的習慣組合控制面板狀態欄則是用來顯示當前圖像的有關狀態及一些簡要說明和提示工具箱的使用
【選框】工具單擊【選框】工具不放,會彈出如圖所示的隱藏工具面板【選框】工具用于在被編輯圖像中選取一個工作區域【SingleRowMarqueeTool(M)】(單行選框)工具是用于選取圖像中任一橫行象素【SingleColumnMarqueeTool(M)】(單列選框)工具用于選取圖像中任一豎行象素工具箱的使用【套索】工具【套索】工具也是重要的選圖工具,主要是用于選取不規則區域。【LassoTool(L)】(套索)工具用于手動選擇一些極不規則的區域【PolygonalLassoTool(L)】(多邊形套索)工具用于選擇不規則多邊形【MagneticLassoTool(L)】(磁性套索)工具可選擇圓滑曲線Photoshop【MagicWandTool(W)】(魔術棒)工具用于選取圖像中顏色近似的一個封閉區域雙擊工具箱中的圖標,可以打開相應工具的控制面板,在控制面板里可以修改顏色的容差以決定選取色域的大小【TypeTool(T)】(文本)工具【TypeTool(T)】(文本)工具用于在圖像中添加文字,實心的代表生成文字時會生成文字圖層空心的代表生成文字時只在本層生成文字選區有“↓”標記的表示豎直排版無“↓”標記的表示橫向排版常用的著色工具:【AirbrushTool(J)】(噴槍)【PaintbrushTool(B)】(畫筆)濾鏡(Filter)
濾鏡是一些專門設計用于生成圖像特殊效果的工具使用濾鏡工具時所受的限制:在位圖、索引圖、48位RGB圖、16位灰度圖等色彩模式下,不允許使用濾鏡工具;在CMYK、Lab等模式下,不允許使用畫筆描邊、素描、視頻、紋理、藝術效果等五種濾鏡工具一般情況下,我們提倡用RGB模式編輯圖像,這樣就可不受阻礙的使用濾鏡工具了。濾鏡(Filter)濾鏡工具的使用方法:用選擇工具選擇欲應用濾鏡的圖像區域(不選擇時,濾鏡默認對本層全圖進行操作)。單擊菜單欄里的【Filter】菜單,選擇濾鏡組的名稱,打開子菜單項。單擊子菜單項中帶有省略號“…”的選項,將會打開濾鏡對話框;若單擊沒有省略號“…”的選項便會直接進行濾鏡變化而不出現任何提示。若打開對話框,可在對話框中設置各項參數及選項,如果選擇對話框中的“預覽”復選框,還可以進行預覽。決定好效果后便可點“OK”按鈕,將濾鏡應用到圖像中。圖層(Layer)
圖層就好像把很多層畫疊加在一起,編輯修改都可分別進行一個圖像文件最多可設置100個圖層蒙版通道
蒙版與選擇區域相似,不同的是當圖像加上了蒙版后,蒙版蒙住的圖像區域將受到保護,所做的各種操作只影響沒被蒙上的區域蒙版由一個灰度圖來表示,黑色表示圖像中沒被選擇的部分,白色表示被選擇了的部分,而不同層次的灰度表示蒙住的程度(即羽化效果),我們可以在灰度圖里使用各種工具為圖像制出選區蒙版通道圖像文件的格式轉換
PSD格式:它是Photoshop軟件的缺省文件格式。它支持所有文件類型,能保存沒有合并的圖層和通道,蒙版等信息。但缺點是很少有其它的圖像軟件能讀取這種格式,且存盤容量極大JPEG:它是一種有損壓縮,是較有效常用的一種壓縮格式,Photoshop5.5支持11級壓縮程度:0是圖像文件最小,圖像質量最低;12是質量最高,但文件最大。一般我們會選擇5級以上來保證圖像質量TIFF格式:用于應用軟件交換的文件格式,它是一種無損壓縮方式BMP格式:它是Windows下使用的標準圖像文件格式。存盤時,可以選擇是“Windows”格式還是“OS/2”格式,選擇1、4、8、24位四種形式,選擇4位、8位的話,還可以設置RLE方式進行壓縮,這種壓縮方式對圖像毫無損傷圖像文件的格式轉換圖形和動畫圖形數據
計算機圖形學是研究怎樣用計算機生成、處理和顯示圖形的一門學科。它著重討論怎樣將數據和幾何模型變成可視的圖象;或對自然界已存在對象通過獲取相關數據建立幾何模型生成的圖象,以便于分析處理。圖形的顯示形式也稱為圖象,但和一般意義的圖象處理技術不同,后者側重于將客觀世界中原來存在的物體映象處理成新的數字化圖象,關心問題是如何濾掉噪聲、壓縮數據、提取特征、三維重建等內容。在多媒體數據中,無法從客觀世界直接攝取的可視信息,就可用圖形技術來制作,這些數據主要包括文字、圖形、動畫。
圖形包括二維空間及三維空間圖形,其中二維圖形僅能表現圖形中各部分簡單的位置關系三維圖形經真實感處理,將使圖形能表達出空間、位置、材質、明暗等接近自然的真實感效果。動畫是圖形對象賦予運動屬性后制作的連續畫面效果,需要專門的軟件工具制作。圖形數據
圖形數據圖形文件的格式通過圖形原語和它們的屬性來描述。圖形本身決定了哪些原語被支持,諸如線型、線寬、顏色之類的屬性影響著圖形畫面的輸出。這種表示需要在圖形顯示時被轉換成低級圖象的點陣。高級原語的優點是減少了存儲每幅圖象需要的數據,容易操縱圖形圖象,缺點是需要更多的步驟來將圖形原語及其屬性轉換成它的圖象象素。
對圖形軟件開發產生廣泛影響的標準有PHIGS,GKS和OPENGL等。計算機動畫計算機動畫(ComputerAnimation)是用計算機生成一系列可供實時演播的連續畫面的技術,它可把人們的視覺引向一些客觀不存在或做不到東西,并從中得到享受。計算機動畫是使用計算機作為工具來產生動畫的技術,計算機在動畫制作過程中起著大量的不同的作用,表現在畫面創建、著色、錄制、特技剪輯、后期制作等各個環節。
基本概念在過去幾十年里,計算機動畫一直是人們研究的熱點在全球的圖形學盛會Siggraph上,幾乎每年都有計算機動畫的論文和專題隨著計算機圖形學和硬件技術的高速發展,可以用計算機生成高質量的圖像,促使計算機動畫技術飛速地發展起來應用領域計算機動畫的應用領域十分廣泛影視作品制作科學研究視覺模擬電子游戲工業設計教學訓練軍事仿真過程控制平面繪畫建筑設計...動畫發展的歷史
1831年,法國人JosephAntoinePlateau把畫好的圖片按照順序放在一部機器的圓盤上,圓盤可以在機器的帶動下轉動。這部機器還有一個觀察窗,用來觀看活動圖片效果。在機器的帶動下,圓盤低速旋轉。圓盤上的圖片也隨著圓盤旋轉。從觀察窗看過去,圖片似乎動了起來,形成動的畫面,這就是原始動畫的雛形。1906年,美國人JSteward制作出一部接近現代動畫概念的影片,片名叫“滑稽面孔的幽默形象”(HumorousPhaseofaFunnyFace)。1908年法國人EmileCohl首創用負片制作動畫影片。所謂負片,是影象與實際色彩恰好相反的膠片,如同今天的普通膠卷底片。采用負片制作動畫,從概念上解決了影片載體的問題,為今后動畫片的發展奠定了基礎。我國民間的走馬燈和皮影戲,可以說是動畫的一種古老形式。
動畫發展的歷史
1909年,美國人WinsorMccay用一萬張圖片表現一段動畫故事,這是迄今為止世界上公認的第一部象樣的動畫短片。從此以后,動畫片的創作和制作水平日趨成熟,人們已經開始有意識的制作表現各種內容的動畫片1915年,美國人EerlHurd創造了新的動畫制作工藝,他先在塑料膠片上畫動畫片,然后再把畫在塑料膠片上的一幅幅圖片拍攝成動畫電影。多少年來,這種動畫制作工藝一直被沿用著。動畫發展的歷史
從1928年開始,世人皆知的WaltDisney逐漸把動畫影片推向了顛峰。他在完善動畫體系和制作工藝的同時,把動畫片的制作與商業價值聯系了起來,被人們譽為商業動畫之父。直到如今,他創辦的迪斯尼公司還在為全世界的人們創造出豐富多彩的動畫片。“迪斯尼”----20世紀最偉大的動畫公司。
動畫發展的歷史
什么是動畫
動畫是通過連續播放一系列畫面,給視覺造成連續變化的圖畫。基本原理與電影、電視一樣,都是視覺原理。醫學已證明,人類具有“視覺暫留”的特性,就是說人的眼睛看到一幅畫或一個物體后,在1/24秒內不會消失。利用這一原理,在一幅畫還沒有消失前播放出下一幅畫,就會給人造成一種流暢的視覺變化效果。●早期的動畫動畫原理觀看動畫的機器-1906●
視覺效果教學進程動畫的特點動畫是指把一些原本沒有生命(不活動)的東西,經過制作成影片(或電視)并放映后,成為有生命的東西。因此.廣義的動畫包含了“剪紙片”木偶片”等藝術形式。在中國它們也被稱為“美術片”或“卡通片”。它們有兩個最重要的特征:它們的影像是用電影膠片或錄影帶以逐格記錄的方式制作出來的。這些影像的“動作”是利用設計者的想像和虛幻創造出來的,而不是原本就存在再被攝影機記錄下來的景物。在動畫片的制作中,研究物體怎樣運動(包括他們運動的軌跡、方向,以及所需的時間)的意義,遠大于對單張畫面安排的考慮。所以相對每一格畫面來說,我們應該更關心“每一格畫面與下一格畫面之間所產生的效果”。動畫大師諾曼.麥克拉倫(NormanMclaren)說:動畫不是“會動的畫”的藝術,而是“畫出來的運動”的藝術。
動畫的特點動畫的本質動作的變化是動畫的本質
——英國動畫大師JohnHalas●傳統動畫分類(1)全動畫——為追求畫面完美和動作流暢,按照24幀/s制作動畫(2)半動畫——又名“有限動畫”。為追求經濟效益,6幀/s的動畫●傳統動畫的性質——由多幅畫面構成,稱為“幀動畫”Frame1Frame2Frame3Frame4Frame5Frame6Frame7動畫的分類從制作技術和手段看,動畫可分為以手工繪制為主的傳統動畫和以計算機為主的電腦動畫。按動作的的表現形式來區分,動畫大致分為接近自然動作的“完善動畫”(動畫電視)和采用簡化、夸張的“局限動畫”(幻燈片動畫)。從空間的視覺效果上,可分為平面動畫(《小虎還鄉》)和三維動畫(《最終幻想》)。從播放效果上,可以分為順序動畫(連續動作)和交互式動畫(反復動作)。從每秒放的幅數來講,有全動畫(每秒24幅)(迪斯尼動畫)和半動畫(少于24幅)(三流動畫)之分,中國的動畫公司為了節省資金往往用半動畫做電視片。動畫的分類動畫的變化動作的變化物體位置的變化物體形態的變化顏色的變化材料質地的變化光線強弱的變化動畫的制作過程(1)制作聲音對白和背景音樂(2)制作關鍵畫面(3)繪制動畫畫面(4)復制到膠片上(5)上色(6)核實檢查動畫畫稿(7)拍攝電影膠片(8)后期制作傳統動畫的制作過程
總體設計階段
1)劇本。任何影片生產的第一步都是創作劇本,但動畫片的劇本與真人表演的故事片劇本有很大不同。一般影片中的對話,對演員的表演是很重要的,而在動畫影片中則應盡可能避免復雜的對話。在這里最重的是用畫面表現視覺動作,最好的動畫是通過滑稽的動作取得的,其中沒有對話,而是由視覺創作激發人們的想象。
2)故事板。根據劇本,導演要繪制出類似連環畫的故事草圖(分鏡頭繪圖劇本),將劇本描述的動作表現出來。故事板有若干片段組成,每一片段由系列場景組成,一個場景一般被限定在某一地點和一組人物內,而場景又可以分為一系列被視為圖片單位的鏡頭,由此構造出一部動畫片的整體結構。故事板在繪制各個分鏡頭的同時,作為其內容的動作、道白的時間、攝影指示、畫面連接等都要有相應的說明。一般30分鐘的動畫劇本,若設置400個左右的分鏡頭,將要繪制約800幅圖畫劇本--故事板。3)攝制表。攝制表是導演編制的整個影片制作的進度規劃表,以指導動畫創作集體各方人員統一協調地工作。
傳統動畫的制作過程
設計制作階段
1)設計。設計工作是在故事板的基礎上,確定背景、前景及道具的形式和形狀,完成場景環境和背景圖的設計、制作。對人物或其他角色進行造型設計,并繪制出每個造型的幾個不同角度的標準頁,以供其他動畫人員參考。
2)音響。在動畫制作時,因為動作必須與音樂匹配,所以音響錄音不得不在動畫制作之前進行。錄音完成后,編輯人員還要把記錄的聲音精確地分解到每一幅畫面位置上,即第幾秒(或第幾幅畫面)開始說話,說話持續多久等。最后要把全部音響歷程(或稱音軌)分解到每一幅畫面位置與聲音對應的條表,供動畫人員參考。
傳統動畫的制作過程
具體創作階段
1)原畫創作。原畫創作是由動畫設計師繪制出動畫的一些關鍵畫面。通常是一個設計師只負責一個固定的人物或其他角色。
2)中間插畫制作。中間插畫是指兩個重要位置或框架圖之見的圖畫,一般就是兩張原畫之間的一幅畫。助理動畫師制作一幅中間畫,其余美術人員再內插繪制角色動作的連接畫。在各原畫之間追加的內插的連續動作的畫,要符合指定的動作時間,使之能表現得接近自然動作。
傳統動畫的制作過程
3)譽清和描線。前幾個階段所完成的動畫設計均是鉛筆繪制的草圖。草圖完成后,使用特制的靜電復印機將草圖譽印到醋酸膠片上。再用手工給譽印在膠片上的畫面的線條進行描墨。
4)著色。由于動畫片通常都是彩色的。這一步是對描線后的膠片進行著色(或稱上色)。傳統動畫的制作過程
拍攝制作階段1)檢查。檢查是拍攝階段的第一步。在每一個鏡頭的每一幅畫面全部著色完成之后,拍攝之前,動畫設計師需要對每一場景中的各個動作進行詳細的檢查。
2)拍攝。動畫片的拍攝,使用中間有幾層玻璃層、頂部有一部攝象機的專用攝制臺。拍攝時將背景放在最下一層,中間各層放置不同的角色或前景等。拍攝中可以移動各層產生動畫效果,還可以利用攝象機的移動、變焦、旋轉等變化和淡入等特技上的功能,生成多種動畫特技效果。
傳統動畫的制作過程
3)編輯。編輯是后期制作的一部分。編輯過程主要完成動畫各片段的連接、排序、剪輯等。
4)錄音。編輯完成之后,編輯人員和導演開始選擇音響效果配合動畫的動作。在所有音響效果選定并能很好地與動作同步之后,編輯和導演一起對音樂進行復制。再把聲音、對話、音樂、音響都混合到一個聲道上,最后記錄在膠片或錄象帶上。傳統動畫的制作過程
集體項目一部長篇動畫片的生產需要許多人員,有導演、制片、動畫設計人員和動畫輔助制作人員。動畫輔助制作人員是專門進行中間畫面添加工作的,即動畫設計人員畫出一個動作的兩個極端畫面。動畫輔助人員則畫出它們中間的畫面。畫面整理人員把畫出的草圖進行整理。描線人員負責對整理后畫面上的人物進行描線著色人員把描線后的圖著色。由于長篇動畫制作周期較長,還需專職調色人員調色,以保證動畫片中某一角色所著色前后一致。此外還特技人員、編輯人員、攝影人員及生產人員和行政人員。計算機動畫(電腦動畫)計算機動畫的發展計算機動畫是指用計算機技術輔助制作影視動畫片它的發展過程大體上可分為三個階段60年代美國的Bell實驗室和一些研究機構就開始研究用計算機實現動畫片中間畫面的制作和自動上色。這些早期的計算機動畫系統基本上是二維輔助動畫系統(ComputerAssistedAnimation),也稱為二維動畫。1963年美國貝爾實驗室語言編寫了一個稱為BEFLIX的二維動畫制作系統,這個軟件系統在計算機輔助制作動畫的發展歷程上具有里程碑的意義。第二個階段是從20世紀70-80年代中期,計算機圖形、圖像技術的軟、硬件都取得了顯著的發展,使計算機動畫技術日趨成熟,三維輔助動畫系統也開始研制并投入使用。三維動畫也稱為計算機生成動畫(ComputerGeneratedAnimation),其動畫的對象不是簡單地由外部輸入,而是根據三維數據在計算機內部生成的。1982年迪士尼(Disney)推出第一部電腦動畫的電影,就是Tron(中文片譯“電腦爭霸”),使計算機動畫成為計算應用的新領域。1982至1983年間,麻省理工學院(MIT)及紐約技術學院同時利用光學追蹤(OpticalTracking)技術記錄人體動作;演員穿戴發光物體于身體各部份,在指定之拍攝范圍內移動,同時有數部攝影機拍攝其動作,然后經電腦系統分析光點的運動再產生立體活動影像。計算機動畫的發展第三個階段是從1985年到目前為止的飛速發展時期,是計算機輔助制作三維動畫的實用化和向更高層次發展的階段。在這個階段中,首先是由美國的猶他大學開發出世界上第一個完整的且具有實用意義的三維動畫片。在隨后的十年內,計算機輔助三維動畫的制作技術有了質的變化,已經綜合集成了現代數學、控制論、圖形圖像學、人工智能、計算機軟件和藝術的最新成果。以致于有人說:“如果想了解信息技術的發展成就,就請看計算機三維動畫制作的最新作品吧!”計算機動畫的發展計算機動畫目前計算機動畫已經發展成一個多種學科和技術的綜合領域,以計算機圖形學,特別是實體造型和真實感顯示技術(消隱、光照模型、表面質感等)為基礎,涉及到圖像處理技術、運動控制原理、視頻技術、藝術甚至于視覺心理學、生物學、機器人學、人工智能等領域,它以其自身的特點而逐漸成為一門獨立的學科。計算機動畫關鍵技術計算機動畫的關鍵技術體現在計算機動畫制作軟件及硬件上。動畫制作軟件是由計算機專業人員開發的制作動畫的工具,使用這一工具不需要用戶編程,通過簡單的交互式操作就能實現計算機的各種動畫功能。不同的動畫效果,取決于不同的計算機動畫軟、硬件的功能。從另一方面看,動畫的創作本身是一種藝術實踐,動畫的編劇、角色造型、構圖、色彩等的設計需要高素質的美術專業人員才能較好地完成。總之,計算機動畫制作是一種高技術、高智力和高藝術的創造性工作。
視頻與動畫的區別動畫(Animation)和視頻(Video)都是由一系列的靜止畫面按照一定的順序排列而成的,這些靜止畫面稱為幀(frame),每一幀與相鄰幀略有不同。當幀畫面以一定的速度連續播放時,由于是視覺暫留現象造成了連續的動態效果。計算機動畫和視頻的主要差別類似圖形與圖像的區別,即幀圖像畫面的產生方式有所不同。計算機動畫是用計算機產生表現真實對象和模擬對象隨時間變化的行為和動作,是利用計算機圖形技術繪制出的連續畫面,是計算機圖形學的一個重要的分支;數字視頻主要指經過模擬信號源經過數字化后的圖像和同步聲音的混合體。目前,在多媒體應用中有將計算機動畫和數字視頻混同的趨勢。視頻與動畫的區別幀動畫——模擬以幀為基本單位的傳統動畫,占動畫產品的98%平面動畫——以傳統平面繪畫為基礎的動畫顏色動畫——形成顏色流動效果的動畫變形動畫——主體變形效果的動畫矢量動畫——經過電腦運算而確定的運行軌跡和形狀的動畫空間動畫——形成三維造型并進行空間運動的動畫電腦動畫的種類計算機動畫的原理與傳統動畫基本相同,只是在傳統動畫的基礎上把計算機技術用于動畫的處理和應用。計算機動畫是指采用圖形與圖像的數字處理技術,借助于編程或動畫制作軟件生成一系列的景物畫面,其中當前幀畫面是對前一幀的部分修改。運動是動畫的要素,計算機動畫是采用連續播放靜止圖像的方法產生景物運動的效果。運動不僅指景物的運動,還包括虛擬攝像機的運動、紋理、色彩的變化等,輸出方式也多種多樣。計算機動畫所生成的是一個虛擬的世界,畫面中的物體并不需真正去建造,物體、虛擬攝像機的運動也不會受到什么限制,動畫師幾乎可以隨心所欲地編織他的虛幻世界。計算機動畫的特點由多幀連續圖像組成的動畫效果
關鍵幀(原畫)的產生
關鍵幀以及背景畫面,可以用攝象機、掃描儀、數字化儀實現數字化輸入,用掃描儀輸入鉛筆原畫,再用電腦生產流水線后期制作,也可以用相應軟件直接繪制。動畫軟件都會提供各種工具、方便繪圖。這大大改進了傳統動畫畫面的制作過程,可以隨時存儲、檢索、修改和刪除任意畫面。傳統動畫制作中的角色設計及原畫創作等幾個步驟,一步就完成了。中間畫面的生成
利用電腦對兩幅關鍵幀進行插值計算,自動生成中間畫面,這是電腦輔助動畫的主要優點之一。這不僅精
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論