




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第卷,第期年月 光譜學與光譜分析,近紅外光譜結合一類支持向量機算法檢測雞蛋的新鮮度林顥,趙杰文。,陳全勝,蔡健榮,周平江蘇大學食品與生物工程學院,江蘇鎮江摘要研究利用近紅外光譜技術結合模式識別方法識別雞蛋的新鮮度,在識別模型建立過程中,引入一類支持向量機()算法解決新鮮蛋和非新鮮蛋訓練樣本數量不平衡問題。首先獲取雞蛋在范圍內的近紅外漫反射光譜,通過主成分分析方法提取光譜數據中的特征信息,優選了個主成分作為模型的輸入向量,然后采用區分新鮮蛋和非新鮮蛋。在模型建立過程中,對相關參數進行了優化,試驗結果顯示在相同條件下,模型識別結果較傳統的支持向量機模型好。最優模型對新鮮蛋和非新鮮蛋的識別率均為,傳
2、統的支持向量機對新鮮度的識別率為,對非新鮮度的識別率卻為。研究結果表明利用近紅外光譜快速識別雞蛋新鮮度方法是可行的;算法為訓練樣本數量不平衡提供了一種有效的解決方法。關鍵詞近紅外光譜;一類支持向量機;檢測;雞蛋;新鮮度中圉分類號:文獻標識碼:()引言雞蛋在加工、儲藏過程中,易因失水或微生物的人侵而導致新鮮度下降,以至于影響其食用價值。雞蛋新鮮度的下降主要是由于卵粘蛋白中二硫化基團及少量碳水化合物等化學成分變化而引起的。近紅外()光譜技術是依據化學成分對近紅外區光譜的吸收特性而進行的測定,已在多個領域得到廣泛應用“,同時也被應用于雞蛋新鮮度的快速無損檢測。等利用近紅外光譜技術結合偏最小二乘()定
3、量分析雞蛋新鮮度,其相關性達到。等采用近紅外光譜結合模式識別的方法定性區分了不同存儲時間的雞蛋,識別率為。在以上研究中,參與建立模型的新鮮蛋和非新鮮蛋樣本均比較充足,且兩類樣本的數量基本相同。通常情況下,在建立模型中,訓練樣本中新鮮雞蛋和非新鮮雞蛋數量往往呈現不平衡狀態。在訓練樣本不平衡的情況下,少鼉樣本對檢測模型可提供的信息很少,傳統的定量或分類模型對少量樣本的檢測能力較差。一類支持向量機(,、,)是在傳統的支持向量機上發展起來的一種分類方法,已在故障監視,金融欺詐檢測等領域顯示了在數據類型不平衡問題上的處理能力一。本文嘗試采用近紅外光譜技術結合一類支持 向量機算法區分新鮮蛋和非新鮮蛋,旨在
4、解決雞蛋快速無損檢測中樣本數不平衡的分類問題。材料與方法試驗材料試驗選用雞蛋樣本個,通過對掃描光譜后的雞蛋樣本進行新鮮度測試,其中個為新鮮蛋(哈夫單位值大于),個雞蛋為非新鮮蛋(哈夫單位值小于)。為了保證模型的識別和預測能力,將個新鮮雞蛋樣本分為兩批,一批個樣本作為訓練集,另一批個獨立樣本作為預測集;個非新鮮雞蛋樣本也分為兩批,一批個樣本作為訓練集,另一批個樣本作為預測集。光譜數據采集試驗采用傅里葉變換近紅外光譜儀(美國公司)掃描雞蛋近紅外光譜。掃描波數范圍為,掃描次數為次,采樣間隔為酊,這樣每條光譜共有個變量。光譜采集時,光纖探頭緊貼著蛋殼表面,在每個蛋殼表面不同位置上選取個點進行采集,取次
5、采集光譜的平均值作為該樣本的原始光譜。試驗時,保持室內的溫度和濕度基本一致。圖為一個新鮮蛋和一個非新鮮蛋樣本的近紅外光譜。收稿日期:修訂日期:基金項目:國家科技支撐計劃項目()資助作者簡介:林顥,年生,江蘇大學食品與生物工程學院博士研究生:(馬通訊聯系人:光譜學與光譜分析第卷筻。三腳匹:一類支持向量機分析方法一類支持向量機(:)算法的核心思想是將原點作為負類代表,通過核函數將輸入樣本映射到特征空間中,然后,將其以最大間隔同原點分離仉¨。與傳統的分類器不同,把樣本分為目標樣本和非目標樣本,其目的是估計空間中包含目標樣本的最小區域。在構造分類器時,“利用目標類樣本的信息在保證泛化性能或其
6、他目標條件下,通過歸納學習得到一個能把目標類樣本和非目標類樣本區分開。對于給定數據集五五剮,為使算法具有一定魯棒性,引入非零的松弛變量,目標函數如下可擊邑()(垂()一,式中,(,是預先設定的參數,和支持向量個數密切相關。是全部支持向量個數的下界,稱為屬性。可以得到與此問題相應的對偶形式,一專口(,習)”一()吉,口對于決策函數,當樣本落在覆蓋區域內部時,取值為;反之,取值為一。對于測試樣本來說,依據其落在特征空間中超平面的哪一側來決定其所屬類別。數據分析在(。)的軟件平臺上完成。結果與分析主成分分析由于近紅外光譜信號之間存在一定相關性,造成一定量的信息冗余。主成分分析可以避免建模中的信息冗余
7、,在分析中起到簡化數據的目的。圖是訓練集光譜矩陣前個主成分得分圖,它表明校正集中的樣本點在該三維平面上的投影。從圖可以看出,部分新鮮蛋和非新鮮蛋在三維平面上的投影點分布比較分散,可通過主成分分析直接區分開另有一部分投影點則有相互交叉的區域,難以區分。可能是由于這些新鮮蛋的新鮮度較低,與非新鮮蛋比較接近。因此,需采用模式識別對主成分分析結果進一步分析判別。通過分析,發現前個主成分累積方差貢獻率達,可反映絕大部分原始光譜信號的特征信息,因此本研究采用了個主成分作為的輸入向量。腳啪(吣)帆岫一類支持向量機中的參數優化一類支持向量機是將輸入向量通過核函數映射到特征空間中,然后,以最大間隔將其與原點分離
8、。核函數的選取對模型判別結果有較大影響。比較幾種常見的核函數(線性內核、多項式內核、徑向基內核),徑向基內核作為非線性的核函數,可處理響應光譜信號和結果之間的非線性關系,有比線性內核更強的處理能力,但卻有很簡潔的函數結構,減少了訓練過程中的復雜性。因此,本文選擇了徑向基作為一類支持向量機模型的內核函數。在模型的建立過程中。樣本對目標類的隸屬度闞值口及徑向基核函數的帶寬盯對模型判別的結果有一定影響亂。因此,在建立模型之前,需對這些參數進行優化,提高模型檢測精度。首先,對參數,和進行大范圍搜索取值優化,初步試驗結果顯示,參數礦的值在之間,口值在之間時,()模型能取得最好的結果。然后對這兩個參數進行
9、具體優化,結果如圖顯示,本文取個口值(從)和個礦值(),步長均為,以獨立樣本預測集的判別率優選參數。當,口隱們恤礦第期光譜學與光譜分析時,模型結果可取得最佳結果,其中新鮮雞蛋和非新鮮雞蛋樣本的識別率均為。優化參數時,當步長取值小于時,參數優化效果不再明顯,對模型結果影響不大。一類和兩類支持向量機分類結果比較本研究同時采用傳統的兩類支持向量機識別雞蛋樣本,對模型的相關參數也進行了優化。其最優模型與一類支持向量機結果比較如表所示。從表可以看出,兩類支持向量機模型對新鮮蛋的識別率都達到了,但卻完全無法識別獨立非新鮮蛋樣本。而一類支持向量機對獨立新鮮蛋和非薪鮮蛋樣本的識別率均為。由讎支持向量機預測集判
10、別結果新鮮蛋非新鮮蛋傳統的是將輸入的變量通過非線性映射轉換到高維特征空間,然后在高維特征空間中再構造最優超平面【。在訓練模型時需要兩類數據,超平面的劃分依靠位于超平面兩側附近的支持向量樣本。在不同類別的樣本出現概率大致相當時,能取得較好結果。但當一類樣本數量不足以支持超平面的劃分時,這樣就導致超平面過于靠近該類別樣本群,分類模型嚴重向相反方向傾斜。在本研究中,兩類樣本數量出現較嚴重的不平衡,分類模型嚴重向多數類別傾斜,以至于無法識別少量的非新鮮蛋樣本。在雞蛋新鮮度的快速無損檢測中,少數的非新鮮蛋樣本恰是需要關注和檢測的對象。方法是一種單分類方法,主要關注目標類別的特點,在預測時只是判別樣本是否
11、屬于目標類因而不存在兩類樣本的不平衡問題,預測結果也不會向多數類傾斜。此外,對于不平衡類別問題的意義是,如果來自邊界一側實例樣本的支持不可靠,那么就依靠可以提供很好支持的那類實例樣本確定分類面孔。因此在實際中,如果方法用一類目標預測效果不好時,可以試圖改變目標類,以期改善預測能力。在兩類樣本都可用時,為了能夠更加準確地刻畫出劃分超平面,通常會選擇數量較多的樣本作為目標類。依靠一類數據進行分類器訓練的特點,從根本上避免了訓練數據類別不平衡的影響,使得它在處理許多樣本數量不平衡問題時具有比傳統的兩類分類器有更明顯的優越性。結論試驗采用近紅外光譜結合、冊模式識別方法對新鮮蛋和非新鮮蛋進行快速無損檢測。在兩類樣本數量出現較嚴重的不平衡時,模型的性能較傳統的模型優越。模型對新鮮蛋和非新鮮蛋的識別率都達到。研究結果表明利用近紅外光譜快速識別雞蛋新鮮度方法是可行的;同時應用算法為雞蛋新鮮度檢測中存在的樣本不平衡問題提供了一種新的解決方法,具有良好的應用前景。參考文獻,。,:,。,:。,(金向軍,張勇,謝云飛,等)(光譜學與光譜分析),():,(鄒小波趙杰
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論