




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)庫技術(shù)的飛速發(fā)展,人們獲取信息的渠道越來越多樣化,所擁有的數(shù)據(jù)也越來越龐大,這對數(shù)據(jù)信息的存儲、管理和分析提出了更高的要求,傳統(tǒng)的統(tǒng)計方法面臨著巨大的挑戰(zhàn)。尤其在油氣田生產(chǎn)實踐中,開采所獲得的數(shù)據(jù)更是驚人,如何從海量的開采數(shù)據(jù)中提取地層特征模式,以便對油氣做出更精確的描述,是實現(xiàn)油氣識別的關(guān)鍵。而數(shù)據(jù)挖掘技術(shù)正是解決這一問題的關(guān)鍵技術(shù)。數(shù)據(jù)挖掘是從大量的、有噪聲的、不完全的、隨機的、模糊的數(shù)據(jù)中提取隱含其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘技術(shù)是解決數(shù)據(jù)量大而知識匱乏的有效途徑。它包括分類、聚類、可視化、關(guān)聯(lián)、模糊評判、決策樹、遺傳算法、神經(jīng)網(wǎng)
2、絡(luò)和不確定性處理等技術(shù)方法。近年,數(shù)據(jù)挖掘技術(shù)在油氣田開發(fā)中得到了廣泛應(yīng)用。本文在對數(shù)據(jù)挖掘定義和常用方法研究的基礎(chǔ)上,研究了基于改進的遺傳BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法,并應(yīng)用于油氣識別中,取得了一定實效。1改進的遺傳BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘算法1.1算法概述遺傳神經(jīng)網(wǎng)絡(luò)GNN(Genetic Neural Network的主要思想是利用遺傳算法GA(Genetic Algorithm的全局性優(yōu)點來克服誤差反向傳播BP(Back Propagation算法的易局部收斂和收斂慢的缺陷。同時,GA與BP算法的結(jié)合也解決了單獨利用GA只能在短時間內(nèi)尋找到最優(yōu)解的近似解這一問題,引入BP的梯度下降算法將會避
3、免這種現(xiàn)象。本文以遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的方式將兩者組合在一起:先用GA優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)值組合,直到適應(yīng)函數(shù)的平均誤差達到一定的精度值。在此基礎(chǔ)上再用BP算法進行局部優(yōu)化。基本思想是先用GA粗選神經(jīng)網(wǎng)絡(luò)權(quán)值,再用BP算法精細與優(yōu)化。1.2算法步驟遺傳BP神經(jīng)網(wǎng)絡(luò)的算法步驟:(1隨機產(chǎn)生一組分布,然后采用實數(shù)編碼方案對該組中的每個權(quán)值進行編碼,進而構(gòu)造出一個個染色體(每個染色體代表神經(jīng)網(wǎng)絡(luò)的一種權(quán)值分布,在網(wǎng)絡(luò)結(jié)改進的遺傳BP神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘算法及應(yīng)用胡劍策1,吳國平2(1.溫州醫(yī)學(xué)院,浙江溫州325035;2.中國地質(zhì)大學(xué),湖北武漢430074摘要:介紹了數(shù)據(jù)挖掘的定義和常用方法,研究了基于
4、遺傳BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法,并對其交叉算子進行了改進,提高算法訓(xùn)練速度。實驗結(jié)果表明,將該方法應(yīng)用于油氣識別中,效果良好,具有一定的實際應(yīng)用價值。關(guān)鍵詞:數(shù)據(jù)挖掘;遺傳BP神經(jīng)網(wǎng)絡(luò);油氣識別中圖分類號:TP311;TE325文獻標識碼:A文章編號:1674-7720(201102-0082-03 Research and application of data mining algorithm basedon improved genetic BP-neural networkHu Jiance1,Wu Guoping2(1.Wenzhou Medical College,Wenzhou3
5、25035,China;2.China University of Geosiences,Wuhan430074,ChinaAbstract:The definitions and commonly used methods of data mining were introduced.And the data mining algorithm based on improved genetic BP-neural network was brought forward.Then,the improvement to its overlapping operator was made to r
6、aise its training speed.Finally,the algorithm was applied in Oil-gas recognition,the results of which proved that the application ef-fects were satisfactory and the approaches were provided with particular popularized values.Key words:data mining;genetic BP-neural network;oil-gas recognition82微型機與應(yīng)用
7、2011年第30卷第2期微型機與應(yīng)用2011年第30卷第2期歡迎網(wǎng)上投稿 圖1遺傳BP 神經(jīng)網(wǎng)絡(luò)算法流程圖開始生成BP 三層結(jié)構(gòu)把BP 網(wǎng)絡(luò)權(quán)值序列作為GA 的染色體隨機生成初始群體適應(yīng)度檢測評估遺傳算子達到精度要求或最大代數(shù)?N該染色體作為BP 網(wǎng)絡(luò)權(quán)值BP 優(yōu)化訓(xùn)練結(jié)果滿意?達到最大訓(xùn)練次數(shù)?失敗成功YYNY 構(gòu)和學(xué)習(xí)規(guī)則已定的前提下,該染色體就對應(yīng)一個權(quán)值取特定值的神經(jīng)網(wǎng)絡(luò);(2對染色體解碼,構(gòu)建出相應(yīng)的神經(jīng)網(wǎng)絡(luò),計算它的誤差函數(shù),從而確定該染色體的適應(yīng)度值。誤差越小,適應(yīng)度越大;(3選擇若干適應(yīng)度值最大的個體,直接復(fù)制到下一代;(4利用選擇、交叉、變異等遺傳操作算子處理當(dāng)前代的群體,產(chǎn)
8、生下一代群體;(5重復(fù)步驟(2、(3、(4,直到達到設(shè)定的精度要求;(6用BP 神經(jīng)網(wǎng)絡(luò)的梯度下降算法繼續(xù)局部尋優(yōu),直到找到最優(yōu)解。算法流程圖如圖1所示。1.3改進算法和模擬仿真為了提高遺傳神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,以便快速收斂,本文對遺傳算法中的編碼和交叉算子作了適當(dāng)?shù)母倪M。(1編碼遺傳算法常用的編碼方法有實數(shù)編碼和二進制編碼。本文在優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的過程中,采用實數(shù)編碼方式。具體實數(shù)編碼的例子如圖2所示,從左到右讀每一層神經(jīng)元的權(quán)重,讀完第一個隱含層,再讀它的下一層,把所讀到的數(shù)據(jù)依次保存到一個向量中,這樣就實現(xiàn)了神經(jīng)網(wǎng)絡(luò)的實數(shù)編碼。如圖2所示的神經(jīng)網(wǎng)絡(luò),它的權(quán)重編碼向量(即染色體為:0.3,
9、-0.8,-0.2,0.6,0.1,-0.l ,0.4,0.5(2改進的交叉算子經(jīng)典的交叉算子是沿著基因組(染色體長度任意地方切開的,這就極有可能在某個神經(jīng)元(比如第二個的權(quán)重中間斷開,也就是在權(quán)重0.6和-0.1之間某處切開。而優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值是以神經(jīng)元為單元組織在一起的,神經(jīng)元是神經(jīng)網(wǎng)絡(luò)中處理信息的基本單元,如果交叉算子將某個神經(jīng)元的權(quán)值斷開,勢必會破壞該神經(jīng)元在此以前所獲得的任何改良。事實上,這樣的交叉操作就像斷裂性突變操作所起的作用。由于經(jīng)典交叉算子的隨機性和破壞性,本文根據(jù)具體問題具體分析的原則,結(jié)合神經(jīng)網(wǎng)絡(luò)權(quán)值分布的特點,提出了一種新的單點交叉算子,它只在神經(jīng)元的邊界上進行切開。在
10、圖2的例子中,就是在第3、4或第6、7的兩個基因之間切開,如小箭頭所示。這樣,在進行雜交時,把神經(jīng)元當(dāng)作一個不可分割的單位,比在染色體上任意一點分裂基因組,更能得到好的效果,訓(xùn)練時間顯著縮減,效率有很大提高。為了進一步驗證改進后算法的性能,本文構(gòu)造了一個檢測樣本空間,分別訓(xùn)練改進前和改進后的遺傳神經(jīng)網(wǎng)絡(luò),訓(xùn)練收斂曲線對比圖如圖3所示。由圖3可以看出,在相同的全局均方誤差下,原來的遺傳BP 神經(jīng)網(wǎng)絡(luò)收斂速度緩慢,而改進后的遺傳BP 神經(jīng)網(wǎng)絡(luò)收斂速度快得多,當(dāng)收斂至10-4時,前者需要150s ,后者只需50s ,顯然,改進后的遺傳BP 神經(jīng)網(wǎng)絡(luò)的效率是原來的3倍。2應(yīng)用2.1訓(xùn)練數(shù)據(jù)本文將改進后
11、的遺傳BP 神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于油氣N83識別。訓(xùn)練樣本空間是以實際勘探測井資料為基礎(chǔ),以試油解釋資料為依據(jù)而建立的。本文以塔北雅克拉某勘探區(qū)1號井測井資料為基礎(chǔ),選取SP (自然電位、GR(自然伽瑪、AC(聲波時差和RILD (深感應(yīng)電阻率4種測井曲線作為特征參數(shù),取各類樣本各25個作為網(wǎng)絡(luò)輸入,理想輸出(即識別目標依據(jù)所選取的樣本分為4類:水層(1000、油層(0100、油水同層(0010、干層(0001,其樣本空間如表1所示。2.2算法參數(shù)設(shè)計本文采用三層的BP神經(jīng)網(wǎng)絡(luò):輸入層神經(jīng)元數(shù)為4,隱含層神經(jīng)元數(shù)為11,輸出層神經(jīng)元數(shù)為4。神經(jīng)網(wǎng)絡(luò)參數(shù)為:學(xué)習(xí)樣本數(shù)為100,訓(xùn)練步長為0.01,收
12、斂誤差為0.0001,最大網(wǎng)絡(luò)訓(xùn)練3000次,傳遞函數(shù)采用正切函數(shù)特性的Sigmoid函數(shù)。遺傳算法參數(shù)為:種群規(guī)模30,交叉概率0.7,變異概率0.1,誤差精度0.01,最大進化代數(shù)1000。2.3結(jié)果分析本文利用訓(xùn)練好的遺傳神經(jīng)網(wǎng)絡(luò)對同一地區(qū)相同地質(zhì)結(jié)構(gòu)的另三口井中15個試油層進行了實際識別。識別結(jié)果如表2所示。由表2數(shù)據(jù)可以看出,識別結(jié)果和試油結(jié)果基本相同,總體識別率達到了86.67%。其中有兩個油層樣本被錯誤地識別成油水同層樣本。導(dǎo)致誤判的原因很多:其一,可能是該樣本的真實地層情況因注水已發(fā)生了改變,與原先取心資料對應(yīng)有誤;其二,分布不合理的油水同層樣本也是造成識別評價誤差的原因,由于
13、油水同層與油層樣本的特征較相似,甚至在某些特征上可能出現(xiàn)交叉,因此兩者有一定的不確定性和模糊性,以至識別不準確。數(shù)據(jù)挖掘技術(shù)是信息科學(xué)領(lǐng)域的前沿課題之一,對它的研究正不斷深入。本文在傳統(tǒng)遺傳神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上,對交叉算子進行改進,提高其訓(xùn)練速度,并將其應(yīng)用于油氣識別,實驗證明識別精度較高,具有一定的理論意義和實際應(yīng)用價值。參考文獻1王東龍,李茂青.基于遺傳算法的數(shù)據(jù)挖掘技術(shù)應(yīng)用J.南昌大學(xué)學(xué)報,2005,27(1:81-84.2鄭志軍,林霞光,鄭守淇.一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法J.西安建筑科技大學(xué)學(xué)報,2000,32(1:28-30. 3焦李成.神經(jīng)網(wǎng)絡(luò)計算M.西安:西安電子科技大學(xué)出版
14、社,1996.4王小平,曹立明.遺傳算法理論、應(yīng)用與軟件實現(xiàn)M.西安:西安交通大學(xué)出版社,2002.5李海燕,彭仕宓.應(yīng)用遺傳神經(jīng)網(wǎng)絡(luò)研究低滲透儲層成巖儲集相J.石油與天然氣地質(zhì),2006,27(1:111-117.6王安輝,宇淑穎,張英魁,等.神經(jīng)網(wǎng)絡(luò)在低滲透油田試井解釋中的應(yīng)用J.石油與天然氣地質(zhì),2004,25(3:338-343.(收稿日期:2010-08-19作者簡介:胡劍策,男,1982年生,碩士,助理工程師,主要研究方向:人工智能、計算機網(wǎng)絡(luò)等。吳國平,男,1955年生,教授,主要研究方向:信號處理。表1油氣訓(xùn)練樣本空間訓(xùn)練樣本空間(未歸一化AC/(s/ft 81.201 81.
15、705 81.12671.519 70.905 78.45073.259 71.780 75.63878.751 71.570 63.533GR/API55.28860.22956.18382.31577.62874.27657.46555.94057.211108.656115.371108.123SP/mV2.8803.7694.13655.69053.84556.32645.03545.54348.95280.37979.55080.869RILD/(m0.8080.5560.3094.9434.8104.7413.4053.6394.4329.63811.63918.634輸出模式(1
16、000(1000(1000(1000(0100(0100(0100(0100(0010(0010(0010(0010(0001(0001(0001(0001儲層類型水層水層水層水層油層油層油層油層油水同層油水同層油水同層油水同層干層干層干層干層表2測試樣本空間樣本序號測試樣本空間(未歸一化AC/(s/ft81.77978.57564.65670.18466.74269.11370.43267.15573.41777.43063.84276.18364.13768.71067.756GR/API56.23151.68260.13564.003117.86754.58963.54765.46270.74573.336111.13471.64162.95564.51967.579SP/mV4.1353.82549.97250.81569.54147.83151.42
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園中學(xué)小學(xué)家長會130
- 初中數(shù)學(xué)期中提升訓(xùn)練+2024-2025學(xué)年北師大版數(shù)學(xué)七年級下冊
- 1《開開心心上學(xué)去》公開課一等獎創(chuàng)新教學(xué)設(shè)計(表格式)-2
- 傣族民間舞動作組合
- 幼兒聲勢律動《外婆的澎湖灣》
- 酒店管理培訓(xùn)項目合作開發(fā)合同
- 2025標準個人之間的借款合同協(xié)議
- 2025年住宅裝修施工合同示范文本
- 項目技術(shù)咨詢合同范本匯編
- 2025版合同范例匯編
- 2025年上半年內(nèi)蒙古森工集團公開招聘工勤技能人員605名易考易錯模擬試題(共500題)試卷后附參考答案
- 駐村隊員個人工作總結(jié)
- 計量標準器具管理制度
- 浙江省臺州市2025屆高三下學(xué)期4月二模試題 英語 含解析
- 第三單元 運算律 單元測試 人教版 數(shù)學(xué) 四年級下冊
- 2024-2025學(xué)年人教版八年級地理下學(xué)期全冊教案
- 4.3.1 呼吸道對空氣的處理 課件人教版(2024)七年級下冊
- 《民航重大安全隱患判定標準(2024 年修訂版)》知識培訓(xùn)
- 2024年保安員資格考試初級理論知識試題庫【模擬題】
- 浙江國企招聘2025上半年湖州市交通投資集團有限公司招聘11人筆試參考題庫附帶答案詳解
- 2025年安徽省示范高中皖北協(xié)作區(qū)第27屆聯(lián)考物理+答案
評論
0/150
提交評論