




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
曲線擬合、回歸和相關曲線擬合實踐中尋求兩個(或多個)變量間存在的關系,擬合給定數據用以確定變量間的近似曲線方程,此過程叫曲線擬合。回歸曲線擬合的主要目的之一是從一個變量(獨立變量)估計另一個變量(相依變量),估計的過程常牽涉到回歸。如果按某個方程的意義從x估計y,我們稱該方程為y關于x的回歸方程。對應的曲線稱為y關于x的回歸曲線。最小二乘法若在近似n個數據點的集合時,對一給定的曲線族的全部曲線,其中有一條曲線的性質:達最小值,則稱該曲線為給定曲線族中的最佳擬合曲線。有這樣性質的一條曲線稱為在最小二乘意義上對數據的擬合,該曲線稱為最小二乘回歸曲線最小二乘直線數據點集(x1,y1),…,(xn,yn)最小二乘直線方程y=a+bx將所有點代入直線方程后相加,我們得到
y=an+bx(或)以及
xy=ax+bx2這兩個方程稱為最小二乘的正規方程。由上面的方程組我們可以達到a,b分別為:我們還可以得到:從上式我們可以看到最小二乘直線通過點,此點稱為此批數據的重心。顯然斜率b與坐標原點無關,所以我們可以通過適當的坐標變換來減少求最小二乘直線的工作量。用樣本方差和協方差表示的最小二乘直線x和y的樣本方差和協方差給定為用這些項,y關于x或x關于y的最小二乘回歸直線分別寫成因為相關系數所以我們可以得到事實上,以上就是x,y的標準化樣本值。我們可以看到僅當r=1時,上面兩式才是表示同一直線,而且全部樣本點都處與這條直線上,因此存在完全線性的相關和回歸。最小二乘拋物線從最小二乘直線推廣到最小二乘拋物線:y=a+bx+cx2其中a,b,c由下列正規方程確定:
y=na+bx+cx2
xy=ax+bx2+cx3
x2y=ax2+bx3+cx4多元回歸上面的概念也可以推廣到更多變量。例如z=a+bx+cy那么確定a,b,c的方程組為
z=na+bx+cy
xz=ax+bx2+cxy
yz=ay+bxy+cy2估計的標準誤差Y關于x回歸曲線離散程度的一個度量這個量稱為y關于x的估計的標準誤差。由于,我們可以看到最小二乘曲線在全部可能的回歸曲線中有最小的估計的標準誤差。在最小二乘直線中對最小二乘直線也能用方差和相關系數表示正如存在一個總體方差的無偏估計一樣,有一個估計的理論標準誤差的平方的無偏估計,有線性相關系數為了考察相關系數的統計意義
我們也能顯示式子的左邊為總變差,右邊的第一項為不可解釋的變差(是隨機的或不可預見的方式引起的),第二項為可解釋變差(可以由最小二乘回歸線得到解釋),所以我們可以得到所以,相關系數可解釋稱總變差中可用最小二乘回歸直線解釋的部分。換句話說,r度量了最小二乘回歸直線擬合樣本數據是如何地好。如果r2=1,我們說有純線性相關。如果r=0,則總變差完全不可解釋。廣義相關系數廣義相關系數定義:我們使用此定義可獲得非線性相關系數。由于相關系數僅是度量一個給定的回歸曲線(曲面)是否較好地擬合了樣本數據。所以,當樣本是非線性的,如果我們得到線性相關系數很小,這并不表明僅有一點相關性,而是僅有一點線性相關。回歸的概率解釋從同一總體抽取不同的樣本作擬合,我們會得到不同的回歸曲線。給定兩個隨機變量X和Y的聯合密度函數和概率函數。如果使E{[Y-g(X)]2}=最小值的y=g(x)曲線稱為Y關于X的最小二乘回歸曲線有如下定理:定理一:y=g(x)=E(Y|X=x)滿足E{[Y-g(X)]2}=最小值,所以它是Y關于X的最小二乘曲線。定理二:如果X和Y是具有二元正態分布的隨機變量,那么Y關于X的最小二乘回歸曲線是一條回歸直線,為前面對樣本的最小二乘回歸的敘述容易推廣到總體上。例如,總體情況下的估計的標準誤差用方差和相關系數項給定為相關的概率解釋總體相關系數提供了給定的總體回歸曲線是否較好地擬合了總體數據地一種度量。前面關于樣本間相關的各種敘述均可以很好地用到總體上。回歸的抽樣理論樣本回歸方程y=a+bx,而總體的回歸方程y=+x。下面是與正態分布有關的一些檢驗:1假設=c的檢驗為了檢驗假設:回歸系數等于某一特定值c,使用統計量它具有n-2自由度的t分布。此結論也可用于從樣本值求總體回歸系數的置信區間2預報值的假設檢驗設y0是x=x0時y的預報值,它是從樣本回歸方程得到的估計,即y0=a+bx0。設yp記對總體而言對應x=x0的y的預報值,那么統計量有n-2個自由度的t分布。由此能求得預報得總體值得置信限2預報的平均值的假設檢驗設y0是x=x0時y的預報值,它是從樣本回歸方程得到的估計,即y0=a+bx0。設記對總體而言對應x=x0的y的預報平均值,那么統計量有n-2個自由度的t分布。由此能求得預報的平均總體值的置信限相關的抽樣理論我們經常要從樣本的相關系數r估計總體的相關系數,或者檢驗有關的假設。為此我們必須知道r的抽樣分布。在=0的情況,這個對稱是對稱的,且有一個具有t分布的統計量可以利用。對0,這個分布是偏斜的,這種情況,Fisher做出的變換構造了一個統計量,它近似正態分布。下面的檢驗概括了這一構造。1假設=0的檢驗使用下列事實:統計量有n-2個自由度的t分布。2假設=00的檢驗使用下列事實:統計量有近似正態分布,具有一下均值和標準差這一事實也能用于求相關系數的置信限。3相關系數間的差的顯著性從大小分別為n1和n2的樣本得到兩個相關系數r1和r2,確定它們間是否有顯著差異,利用2中的統計量對應r1和r2計算出Z1和Z2,然后使用下列事實:檢驗統計量是近似正態分布。相關和相依當兩個隨機變量X和Y有非零的相關系數時,我們知道它們在概率意義上是相依的(也就是聯合分布不能折成邊緣分布的乘積),進而當0時,能使定理二中的那樣方程預報對應X值的Y值。上述意義上的“相關”和“相依”并非必須
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 特定礦種礦產資源勘探與委托運營管理合同
- 電動汽車新能源充電樁建設項目股權投資及運營管理合同
- 民營醫院品牌托管與醫院管理培訓服務協議
- 智能化建筑工程合同審查與施工質量監督協議
- 消防設施維護保養補充協議
- 拼多多品牌店鋪季節性營銷策略執行協議
- 電子數據備份與災難恢復能力保證協議
- 生物有機肥生產專利技術與市場拓展合同
- 抖音火花澳新市場跨境直播帶貨合作協議
- 車債權轉讓協議書
- 北京市通州區2023-2024學年七年級下學期期末數學試題(無答案)
- 2024年江蘇省南京市玄武區玄武外國語學校八年級下學期物理期末模擬卷1
- 河砂、碎石組織供應、運輸、售后服務方案
- 免疫學實驗技術智慧樹知到期末考試答案章節答案2024年哈爾濱醫科大學大慶校區
- 《城軌通信信號基礎設備應》課件-FTGS軌道電路
- 浙江省寧波市鎮海區人教PEP版2022年小學畢業考試英語試卷【含答案】
- 中班語言《傘》課件
- 心悸-《中醫內科學》教案
- 營區物業服務營區物業服務保密措施
- 托槽粘結醫學課件
- 藍曬創作方案
評論
0/150
提交評論