R知識(shí)點(diǎn)總結(jié)整理版_第1頁(yè)
R知識(shí)點(diǎn)總結(jié)整理版_第2頁(yè)
R知識(shí)點(diǎn)總結(jié)整理版_第3頁(yè)
R知識(shí)點(diǎn)總結(jié)整理版_第4頁(yè)
R知識(shí)點(diǎn)總結(jié)整理版_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、R知識(shí)點(diǎn)復(fù)習(xí)第二章:R軟件的使用一、向量1、是命令提示符,“-”或“=”表達(dá)賦值運(yùn)算符; “+”表達(dá)加,“-”表達(dá)減法,“*”表達(dá)乘法,“/”表達(dá)除法,“%/%”表達(dá)整除,“%”表達(dá)取余數(shù),“*”或“”表達(dá)乘方;函數(shù):sqrt() #開(kāi)方log() #取對(duì)數(shù)exp() #取指數(shù)sin();cos();tan() #三角函數(shù) max();min() #求最大最小值mean() #求均值sum() #計(jì)算自變量向量的元素和var(), sd() #計(jì)算樣本方差,計(jì)算原則差c() #把數(shù)據(jù)組合為一種向量rang() #返回涉及最小值和最大值的向量sort() #返回按x的元素從小到大排序的成果向量o

2、rder() #返回使得x的元素從小到大排序的元素下表的向量 numeric(n) #產(chǎn)生有規(guī)律的數(shù)列seq() #等差數(shù)列函數(shù)rep() #反復(fù)第一種自變量若干次paste () #把自變量連城字符串,中間用空格隔開(kāi)3、例如(1)繪制余弦函數(shù)圖 x1=1:100;x1 x2-x1*2*pi/100;x2 y=cos(x2);y plot(x1,y,type=l) #type=l是字母l(2)函數(shù)c()用來(lái)把數(shù)據(jù)組合為一種向量 vectlibrary(xlsReadWrite) d=read.xls(“foo.xls”)3、R中向量默認(rèn)是列向量,byrow=TRUE是指按行排列列表中元素長(zhǎng)度不

3、必同樣,R列表有維數(shù);數(shù)據(jù)框元素必須有相似長(zhǎng)度,有維數(shù)diag(3) #產(chǎn)生三階單位矩陣solve(A) #求矩陣的逆t(A) #求矩陣的轉(zhuǎn)置4、legend函數(shù)用來(lái)在目前圖形的指定坐標(biāo)位置繪制圖例。圖例的闡明文字由向量legend提供. angel參數(shù)指定幾種陰影斜度 density參數(shù)指定幾種陰影密度 fill參數(shù)指定幾種填充顏色 col參數(shù)指定幾種顏色 lty參數(shù)指定幾種線型 pch參數(shù)指定幾種散點(diǎn)符號(hào),為字符型向量 vect參數(shù)也指定幾種散點(diǎn)符號(hào),為字符型向量第三章:數(shù)據(jù)描述性分析一、描述性記錄量1、Sort() #順序記錄量 quantile () #百分位數(shù)length() #長(zhǎng)度

4、 median() #中位數(shù)mean() #均值var() #方差sd() #樣本原則差max()-min() #樣本極差s/sqrt() #原則誤G1-(n*(n+1)/(n-1)*(n-2)*(n-3)*sum(w-m)4)/s4-(3*(n-1)2)/(n-2)*(n-3) #峰度系數(shù)G2 x=rcauchy(1000,1) f=function(p) sum(x-p)/(1+(x-p)2) out out$root1 0.9914451$f.root1 -0.$iter1 5$estim.prec1 6.103516e-05在計(jì)算成果中,$root是方程根的近似解,即估計(jì)值為0.991

5、4451。$f.root是函數(shù)f在近似值處的函數(shù)值。$iter是迭代次數(shù),即用了5次迭代。$estim.prec是近似解與精確解的誤差估計(jì),即近似解與精確解誤差的絕對(duì)值不超過(guò)。三、區(qū)間估計(jì)1、配對(duì)數(shù)據(jù)情形下均值差的區(qū)間估計(jì) 為了調(diào)查應(yīng)用克矽平治療矽肺的效果,今抽查應(yīng)用克矽平治療矽肺的患者10名,記錄下治療前后血紅蛋白的含量數(shù)據(jù),如下表,試求治療前后變化的區(qū)間估計(jì)()。病人編號(hào)12345678910治療前(X)11.315.015.013.512.810.011.012.013.012.3治療后(Y)14.013.814.013.513.512.014.711.413.812.0 X Y t.t

6、est(X-Y) One Sample t-testdata: X - Y t = -1.3066, df = 9, p-value = 0.2237alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: -1.8572881 0.4972881 sample estimates:mean of x -0.68 因此,治療前后變化的區(qū)間估計(jì)為-1.86,0.497.由于0涉及在區(qū)間估計(jì)的區(qū)間內(nèi),因此可以覺(jué)得治療前后病人血紅蛋白的含量無(wú)明顯差別。2、單側(cè)置信區(qū)間估計(jì) 從一批燈泡中隨機(jī)地

7、取5只作壽命實(shí)驗(yàn),測(cè)得壽命(以h計(jì))為1050 1100 1120 1250 1280,設(shè)燈泡壽命服從正態(tài)分布,求燈泡壽命平均值的置信度為0.95的單側(cè)置信下限。 x t.test(x,alternative=greater) One Sample t-testdata: x t = 26.0035, df = 4, p-value = 6.497e-06alternative hypothesis: true mean is greater than 0 95 percent confidence interval: 1064.9 Inf sample estimates:mean of x

8、 1160 因此單側(cè)置信下限為1064.9.第五章:假設(shè)檢查一、正態(tài)總體均值的假設(shè)檢查1、單個(gè)總體的狀況解:原假設(shè):uu0=225 程序:x-c(159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170)source(C:/Users/Administrator/Desktop/R原程序/Ch05/mean.test1.R)mean.test1(x,mu=225,side=1) 運(yùn)營(yíng)成果:mean df T P_value1 241.5 15 0.6685177 0.2569801程序: mean.test1(x,mu=22

9、5,side=1) 運(yùn)營(yíng)成果:mean df T P_value1 241.5 15 0.6685177 0.2569801由上述成果可知,p=0.2569不小于0.05,因此接受原假設(shè)2、兩個(gè)總體的狀況解:原假設(shè):兩種措施治療后的患者血紅蛋白無(wú)差別;備擇假設(shè):兩種措施治療后的患者血紅蛋白有差別。x-c(113,120,138,120,100,118,138,123)y chisq.test(c(335,125,160),p=c(9,3,4)/16) Chi-squared test for given probabilitiesdata: c(335, 125, 160) X-squared

10、 = 1.362, df = 2, p-value = 0.5061P值= 0.50610.05,接受原假設(shè),即大麥芒性的分離符合9:3:4的比例。三、K-S檢查 對(duì)一臺(tái)設(shè)備進(jìn)行壽命檢查,記錄10次無(wú)端障工作時(shí)間,并按從小到大的順序排列如下(單位:h) 420 500 920 1380 1510 1650 1760 2100 2300 2350檢查此設(shè)備無(wú)端障工作時(shí)間的分布與否服從的指數(shù)分布? x ks.test(x,pexp,1/1500) One-sample Kolmogorov-Smirnov testdata: x D = 0.3015, p-value = 0.2654altern

11、ative hypothesis: two-sided 其P值不小于0.05,無(wú)法回絕原假設(shè),因此覺(jué)得此設(shè)備無(wú)端障工作時(shí)間的分布與否服從的指數(shù)分布。第六章:回歸分析 一、一元線性回歸解:程序:x-c(0.10,0.11,0.12,0.13,0.14,0.15,0.16,0.17,0.18,0.20,0.21,0.23) y-c(42.0,43.5,45.0,45.5,45.0,47.5,49.0,53.0,50.0,55.0,55.0,60.0) lm.sol|t|) (Intercept) 28.493 1.580 18.04 5.88e-09 *x 130.835 9.683 13.51

12、9.50e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.319 on 10 degrees of freedomMultiple R-squared: 0.9481, Adjusted R-squared: 0.9429 F-statistic: 182.6 on 1 and 10 DF, p-value: 9.505e-08 程序: summary(lm.sol)運(yùn)營(yíng)成果:Call:lm(formula = y 1 + x)Residuals: Min 1Q Median 3Q

13、Max -2.0431 -0.7056 0.1694 0.6633 2.2653 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 28.493 1.580 18.04 5.88e-09 *x 130.835 9.683 13.51 9.50e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.319 on 10 degrees of freedomMultiple R-squared: 0.9481, Adjus

14、ted R-squared: 0.9429 F-statistic: 182.6 on 1 and 10 DF, p-value: 9.505e-08 故:得到的回歸方程為:Y=28.493+130.835X二、多元線性回歸以及逐漸回歸解:(1)、A-data.frame(X1=c(0.4,0.4,3.1,0.6,4.7,1.7,9.4,10.1,11.6,12.6,10.9,23.1,23.1,21.6,23.1,1.9,26.8,29.9),X2=c(52,23,19,34,24,65,44,31,29,58,37,46,50,44,56,36,58,51),X3=c(158,163,37

15、,157,59,123,46,117,173,112,111,114,134,73,168,143,202,124),Y=c(64,60,71,61,54,77,81,93,93,51,76,96,77,93,95,54,168,99)lm.sol|t|) (Intercept) 43.65007 18.05442 2.418 0.02984 * X1 1.78534 0.53977 3.308 0.00518 *X2 -0.08329 0.42037 -0.198 0.84579 X3 0.16102 0.11158 1.443 0.17098 -Signif. codes: 0 * 0.0

16、01 * 0.01 * 0.05 . 0.1 1 Residual standard error: 19.97 on 14 degrees of freedomMultiple R-squared: 0.5493, Adjusted R-squared: 0.4527 F-statistic: 5.688 on 3 and 14 DF, p-value: 0.009227 回歸方程為:Y=43.65007+1.78534X1-0.08329X2+0.16102X3.(2)、由(1)的成果可得,F(xiàn)檢查中p值不不小于0.05,因此回歸方程明顯.但某些回歸系數(shù)的t檢查中p值不小于0.05,因此有些回

17、歸系數(shù)不明顯.(3)、lm.step-step(lm.sol)Start: AIC=111.27Y X1 + X2 + X3 Df Sum of Sq RSS AIC- X2 1 15.7 5599.4 109.32 5583.7 111.27- X3 1 830.6 6414.4 111.77- X1 1 4363.4 9947.2 119.66Step: AIC=109.32Y X1 + X3 Df Sum of Sq RSS AIC 5599.4 109.32- X3 1 833.2 6432.6 109.82- X1 1 5169.5 10768.9 119.09summary(lm.

18、step)Call:lm(formula = Y X1 + X3, data = A)Residuals: Min 1Q Median 3Q Max -29.713 -11.324 -2.953 11.286 48.679 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 41.4794 13.8834 2.988 0.00920 *X1 1.7374 0.4669 3.721 0.00205 *X3 0.1548 0.1036 1.494 0.15592 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 19.32 on 15 degrees of freedomMultiple R-squared: 0.5481, Adjusted R-squared: 0.4878 F-statistic: 9.095 on 2 and 15 DF, p-value: 0.002589 由上述成果可以看出,X3仍不明顯.接下來(lái)運(yùn)用drop1函數(shù)做逐漸回歸:drop1(lm.step) Single term deletionsModel:Y X1 + X3 Df Sum of Sq RSS AIC 559

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論