基于haar小波變換的時間序列多尺度分辨方法_第1頁
基于haar小波變換的時間序列多尺度分辨方法_第2頁
基于haar小波變換的時間序列多尺度分辨方法_第3頁
基于haar小波變換的時間序列多尺度分辨方法_第4頁
基于haar小波變換的時間序列多尺度分辨方法_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于haar小波變換的時間序列多尺度分辨方法

自20世紀90年代以來,時間序列數據的研究有所增加。運用各種挖掘方法和模型,對時間序列進行分類、聚類、預測和關聯模式挖掘,能提取時間序列中隱含的模式和信息,具有重要的理論意義和應用價值。由于時間序列來源于實際生活的各個應用領域,采樣方法和測量標準都不一致,具有數據短期波動頻繁、存在大量噪聲干擾、以及非穩態的特點,因此對時間序列的分析和處理較為復雜并有著特殊的要求。時間序列數據的聚類分析近年來得到廣泛研究。依據對數據的預處理方法以及數據的組織形式,時間序列聚類方法可分為以下3種:基于原始數據的時間序列聚類;基于特征提取的時間序列聚類;基于模型的時間序列聚類。文中主要研究基于特征提取的時間序列聚類。Agrawal等運用離散傅里葉變換(DFT)將原始時間序列轉換為離散傅里葉系數,從而將時間序列從時域轉換到頻域,將變換后的前幾個分量代替原始時間序列,對時間序列起到降維的作用,在此基礎上利用歐氏距離進行時間序列的相似性查詢和聚類研究。Struzik等通過標準正交變換將時間序列轉換為一組Haar小波基,通過多分辨分析的方式對時間序列的局部斜率進行估計,得到基于Haar小波變換的符號表示法和對數差分表示法,對時間序列的相似性進行度量。Gavrilov基于原始的、經正規化處理的、由原始數據的一階導數組成的證券時間序列,分別運用主成份分析、離散傅立葉變換和分段式正規化方法對時間序列進行降維處理;然后采用層次凝聚法對降維后的數據進行聚類分析。何蘭芳等運用高斯調制小波作為母小波,通過對時間序列進行多重小波分解,去掉部分高頻分量后對數據進行重構,在一組實驗數據和大地電磁測深數據上進行實驗。朱廣彬等依據小波多分辨分析的原理,利用Daubechies4小波對溫度異常時間序列進行5層小波分解,得到分解后的小波系數,將高頻小波系數賦零值然后進行重構,對時間序列進行消噪處理。Dokur和ue6c0lmez分離出第1和第2心音信號,運用小波變換對分割后的心音信號進行特征提取;然后運用增量式自組織神經網絡(ISOM)對心音信號進行分類。1時間序列自組織特征由于小波變換具有在時域和頻域同時局部化和多尺度分辨的功能,能對時間序列數據進行很好的展開和逼近。通過對時間序列進行小波分析,分離和提取數據中的低頻分量和高頻分量,從而將原始數據中包含的信號與噪聲相互分離。通過保留低頻信號,去除高頻噪聲,可獲取時間序列的總體趨勢和全局特征,達到降維的目的。采用的技術路線如圖1所示。獲取時間序列總體趨勢之后,計算時間序列的相關統計量,如:偏差、峰值、均值、方差、各階原點矩、各階中心矩等,獲得時間序列的基本統計特征。以適當的形式組合時間序列的總體趨勢和統計特征量,形成時間序列的待聚類組合特征量,作為自組織特征映射SOM神經網絡聚類模型的輸入數據,進行聚類分析,可改善時間序列數據的聚類精度。這里的研究方案中,選取一階原點矩(均值)、二階中心矩(方差)和三階中心矩為統計特征量,突出時間序列數據的聚類特征。在幾組模擬生成的時間序列數據上進行實驗分析,并將此方法運用于三江平原地區MODIS遙感影像中林地植被的聚類提取,進行了應用研究。2小波變換的局部化特性小波變換是在Fourier變換和Gabor變換的基礎上演變而來的,是繼傅立葉分析之后的又一個重大突破,被廣泛用于信號處理、圖像壓縮、模式識別、計算機視覺、量子物理以及眾多非線性分析領域。小波變換在時域和頻域都具有良好的局部化特性,是一種時頻局部化或稱為時頻定位的工具,被譽為“數學顯微鏡”;同時小波變換還具有多分辨分析的特點,因此特別適用于對非平穩信號進行分析和處理。2.1haar小波尺度函數Haar小波是小波分析發展過程中出現最早的小波,Haar小波實質上是一階的Daubechies小波,也是最簡單的具有緊支特性的顯式正交小波。其小波函數定義為Haar小波尺度函數定義為規范化的Haar小波尺度函數為其中,j為尺度因子,改變j使函數圖形縮小或者放大;i為平移參數,改變i使函數沿x軸方向平移;常數因子2j/2用以滿足內積等于1的條件。2.2多尺度分解haar小波小波變換通過平移母小波可獲得信號的時間信息,而通過縮放小波的寬度或尺度可獲得信號的頻率特性。在小波變換中,近似值是大的縮放因子產生的系數,表示信號的低頻分量。而細節值是小的縮放因子產生的系數,表示信號的高頻分量。通過Haar小波變換對時間序列數據進行多尺度分解,每次分解將時間序列數據分解成包含低頻分量的尺度信號和包含高頻分量和噪聲的細節信號。其中,尺度信號體現了時間序列數據的變化趨勢。對獲得的尺度信號再次執行小波變換進行2次分解,得到新的尺度信號和細節信號。在新的尺度信號上重復小波分解過程,直到分解和降維過程結束。每執行1次Haar小波分解,時間序列的長度縮短為本次分解前的1/2。長度為n的原始時間序列經過m次分解后,長度縮短為n/2m,從而達到降低時間維度的目的。3實驗分析3.1基于自組織特征的som神經網絡訓練過程模擬生成4種不同類型的時間序列信號,即分別生成若干組正弦信號序列、余弦信號序列、正切信號序列和白噪聲信號序列。每組時間序列的長度均為100,分別給這些信號(白噪聲信號除外)加上一定量的在[0,1]區間上服從正態分布的隨機噪聲(衰減到原信號量的40%)。對各組時間序列分別進行3次Haar小波變換縮減維度,提取變換后的尺度信號;然后計算該時間序列的一階原點矩、二階及三階中心矩等統計特征量。將尺度信號與各自的統計特征量組合成新的序列,作為自組織特征映射SOM神經網絡的輸入訓練樣本,對SOM神經網絡進行訓練,以便能很好區分以上各類信號。用白噪聲信號作為以上4類信號的背景信號,以檢驗聚類算法的抗噪性能。3.1.1各類信號在二維平面上的排列服從均勻在尺度為50×50的二維平面上,生成160組含噪正弦時間序列、390組含噪余弦時間序列和280組含噪正切時間序列數據,以及2500組信號強度在區間[0,1]上呈正態分布的隨機噪聲時間序列。所有時間序列的長度均為100,并將噪聲序列的強度衰減到原信號量的30%。計算4類信號中各組時間序列在二維平面上的水平坐標位置和垂直坐標位置,使各類信號在該二維平面上的排列服從均勻分布。生成各類模擬信號量時間序列的計算式為:式(4)~式(7)中,T為取值從0~100的一組長度為100的整型向量;randn(1,100)產生一組在[0,1]區間上取值服從正態分布的時間維度為100的隨機向量。各類信號在二維平面上的坐標位置計算式分別為:式中,rand產生160組取值在[0,1]區間上服從均勻分布的隨機變量;X1={x1,x2,…,xi,…,x160}為160組正弦信號序列在以上二維平面上的水平坐標矢量;Y1={y1,y2,…,yi,…,y160}為160組正弦信號序列在以上二維平面上的垂直坐標矢量,即(xi,yi)為第i組正弦信號時間序列在二維平面上的坐標位置。類似地,X2和Y2分別為390組余弦信號序列在二維平面上的水平坐標矢量和垂直坐標矢量;X3和Y3分別為280組正切信號序列在二維平面上的水平坐標矢量和垂直坐標矢量。模擬生成的實驗數據在二維平面上的分布如圖2所示。3.1.2時間序列數據的統計特征量對模擬生成的正弦信號時間序列、余弦信號時間序列、正切信號時間序列分別進行3次Haar小波變換,所產生的尺度分量和細節分量如圖3~圖5所示。計算以上3類時間序列數據的統計特征量,其中包括原始時間序列的一階原點矩,二階中心矩和三階中心矩。將各類時間序列數據的3個統計量依次附加在3次小波分解后產生的尺度分量之后,作為自組織特征映射SOM神經網絡聚類模型的輸入訓練樣本,進行聚類分析。3.1.3時間序列聚類分析對以上3類時間序列數據以及高斯白噪聲數據進行標準正規化變換;然后運用主成份分析,提取時間序列數據的前10個主成份分量,作為SOM神經網絡聚類模型的輸入向量,設定聚類類別數為6,對SOM神經網絡進行訓練;然后用訓練好的神經網絡對以上3類時間序列數據進行仿真聚類分析,所得到的結果如表1所示。表中,類別中元素總數指聚類算法判定為某類信號的時間序列的個數,如表中聚類算法將303組時間序列判定為正弦序列;命中數指在該類信號中正確分類的時間序列的個數,如表中分類得到的303組正弦序列中,有160組準確的進行了分類。對以上3類時間序列數據以及高斯白噪聲數據進行3次Haar小波變換,取第3次小波變換后生成的尺度分量,作為SOM神經網絡聚類模型的輸入向量;并設定聚類類別數為6,對SOM神經網絡進行訓練,用訓練好的神經網絡對以上3類時間序列數據進行仿真聚類分析,所得到的結果如表2所示。對以上3類時間序列數據以及高斯白噪聲數據進行3次Haar小波變換;然后計算各類時間序列數據的一階原點矩、二階中心矩和三階中心矩,取第3次小波變換后生成的尺度分量,作為SOM神經網絡輸入向量的前11個分量;將以上3個統計量依次作為后3個分量,設定聚類類別數為6,對SOM神經網絡進行訓練,用訓練好的神經網絡對以上3類時間序列數據進行仿真聚類分析,所得到的結果如表3所示。3.1.4聚類分析精度分析基于3種時間序列特征提取方法,即主成份分析法、Haar小波變換法和Haar小波變換結合統計特征量方法,運用SOM神經網絡對時間序列模擬數據進行聚類分析,通過對聚類結果進行分析發現:在基于以上3種特征提取的聚類分析中,余弦信號的聚類精度都很高;在基于主成份分析的聚類分析中,正切信號易與背景白噪聲信號發生混分,使得對正切信號不能很好地分類和提取,而在基于Haar小波變換和基于Haar小波變換與統計特征量的聚類分析中,正切信號能得到很好地劃分和提取。對于正弦信號,在基于以上3種特征提取的聚類分析中,都存在不同程度的誤分。在基于主成份分析的聚類分析中,誤分程度較高;在基于Haar小波變換的聚類分析中,誤分程度和漏分程度都較高;而在基于Haar小波變換與統計特征量的聚類分析中,只存在少量漏分,誤分程度得到很大改善。3.2基于nd-mi和k-me現行聚類分析的林地植被提取通過光譜分析和植被季相分析表明,在已獲取的三江平原地區MODIS影像數據中,由第129,161,193,209,241,257和289天的NDVI和NDMI以及可見光紅波段組成的多波段多時相的影像數據,可以很好地用于三江平原地區林地植被的提取。因此取以上7個時相的NDVI,NDMI和可見光紅波段數據組合成實驗用的時間序列數據,以便基于實際遙感影像數據進行實驗分析。首先將以上7個時相的NDVI,NDMI和可見光紅波段的數據依次排列形成組合的時間序列數據,對該數據進行標準正規化變換,使其取值范圍統一到[0,1]區間上,對規范化的數據執行EnhancedLee濾波;然后執行最小噪聲分離MNF變換,取MNF變換后數據的前3個主成分,運用K-Means聚類算法進行聚類分析,提取影像中的林地植被。截取影像數據中林地植被比較集中的一塊區域,計算該區域范圍內林地提取的生產者精度和用戶精度,得到漏分誤差為0,錯分誤差為41.20%,其生產者精度為100%,用戶精度為58.80%。用以上方法提取的部分林地植被如圖6所示。對規范化后的MODIS影像時間序列數據執行1次Haar小波變換;然后分別求得NDVI,ND-MI和可見光紅波段時間序列數據的一階原點矩、二階中心矩和三階中心矩,共9個統計量,將小波變換分解后得到的尺度分量與這9個統計量組合形成待聚類數據,作為輸入向量輸入到SOM神經網絡聚類模型中進行聚類分析,得到提取的林地植被。取與圖6相同的影像區域,計算在此區域范圍內聚類分析的生產者精度和用戶精度,得到生產者精度為95.88%,用戶精度為92.33%。圖7(a)是原始時間序列數據經標準正規化變換所得到的時間序列;圖7(b)是左側的時間序列經Haar小波變換及統計特征量提取后所形成時間序列;圖8顯示了基于小波變換與統計量進行聚類分析所提取的林地植被;圖9是該研究區域內林地植被的實際分布情況。分析實驗結果發現,基于小波變換與統計量,并運用SOM聚類模型進行林地植被提取,其生產者精度雖然略低于基于MNF變換和K-Means聚類算法提取林地植被的精度。前者的生產者精度為95.88%,后者的生產者精度接近100%。但基于小波變換與統計量所提取的林地分布范圍,其用戶精度較基于MNF變換法的提取精度有了較大提高。前者的用戶精度為92.33%,后者的用戶精度為58.80%。分析其原因,是由于原始時間序列中水體和林地植被之間光譜特征的差別并不十分明顯,因此聚類算法不能很好地分割水體和植被;而經過小波變換和統計特征量提取之后,突顯了水體和林地植被在光譜特征上的統計差別,使得聚類算法能夠很好地劃分水體和林地植被。4時間序列自組織特征1)通過對時間序列數據進行小波分析,將原始時間序列分解成信號成份(低頻分量)與噪聲成份(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論