R語言期末復(fù)習(xí)_第1頁
R語言期末復(fù)習(xí)_第2頁
R語言期末復(fù)習(xí)_第3頁
R語言期末復(fù)習(xí)_第4頁
R語言期末復(fù)習(xí)_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、1智慧教學(xué)及其評價研究智慧教學(xué):教師與家長、管理者共同設(shè)計課程,學(xué)生對學(xué)習(xí)內(nèi)容、方式(小組學(xué)習(xí)、自主學(xué) 習(xí))、測試形式、學(xué)習(xí)進度、學(xué)習(xí)路徑、評價進行選擇,課程符合個體需求,適應(yīng)個性化發(fā) 展。課堂中,教學(xué)內(nèi)容并不是一成不變的, 教師要隨著時代發(fā)展,更改教學(xué)內(nèi)容、測試內(nèi)容, 課程內(nèi)容也可以由學(xué)生討論生成的,讓學(xué)生從內(nèi)容的消費者變?yōu)閯?chuàng)造者。學(xué)習(xí)資源自適應(yīng),全面支持移動泛在學(xué)習(xí),既服務(wù)于在校學(xué)生,又支持社會學(xué)習(xí)者,支持學(xué)分銀行。借助 網(wǎng)絡(luò)平臺,充分表現(xiàn)社會性、實踐性、現(xiàn)實性;采用視真手段,基于真實的課堂、場景、 活動、競賽,將教育與社會實踐以新的形式相結(jié)合。全面支持學(xué)習(xí)者的研究和創(chuàng)造。評價:課堂中,通

2、過智慧教室的攝像設(shè)備,錄制課堂學(xué)生的狀態(tài),針對視頻,用滯后序列分析, 分析學(xué)生的行為,進行過程性評價。通過學(xué)生使用的點陣筆和紙,記錄學(xué)生思考和學(xué)習(xí) 的過程,進行數(shù)據(jù)分析評價。在平臺中,通過學(xué)生訪問各個模塊的數(shù)據(jù),依據(jù)學(xué)生的認(rèn) 知風(fēng)格的不同,進行個性化評價,過程性評價與總結(jié)性評價相結(jié)合。2、回歸定義:回歸是研究一個因變量與一組自變量之間的關(guān)系。即用一個或多個預(yù)測變量 (自變量或解釋變量)預(yù)測響應(yīng)變量(因變量)的方法。回歸分析可以生成一個等式,通過解釋變量來預(yù)剛 響應(yīng)變量。思想:根據(jù)自變量的值預(yù)測因變量的均值 回歸診斷:Rbsi皿恰 « Fitted2001QQFned uahjcs線性

3、:擬合值與殘差圖,分布在y=0的上下,對稱分布,比較好Normal Q-QdiZJDScaie-Locahon正態(tài)性:如果滿足正態(tài)假設(shè),那么圖上的點應(yīng)該落在呈 45度的直線上,否則違反正態(tài)分布。號 m 0 PU a.oP晝一冒pi車 1FTbc va up 同方差性:在水平線上隨機分布,則滿足同方差性'CHR10»DKb 10a 1&Lwagcb殘差與杠桿圖:尋找以下三種類型點 離群點:y軸距離較遠的點 杠桿點:x軸距離較遠的點 強影響點:去掉之后系數(shù)變動很大的點 異常點的改進辦法:刪除觀測點變量變換添加或刪除變量 使用其他回歸方法 回歸數(shù)據(jù)分析C al 1:ImCf

4、ormula = FtunTime Run5i £e,data = producTT on)Residuals:MinIQ Median-23.597 -11.0793.329iQ& 302Max29, 627匚 oeff*fc1ents:Earimate Srd. ErrorS.325150.0并14(intercept) 149.74770 Runsile0.25924value17.98 e.96PrC>|t I)6.00e-13 *l,eie-06 5ign1f. codes: 00.0010.01 2 0.05'0.1 'Ftesidual s

5、tandard error: le. 25 on IS degrees of freedomMultiple R-squared:0.7302, Adjusted R-squared: 0.7152F-statiStic: 48.72 on 1 and IS DF, p-value1.615e-O6Residuals(殘差)對殘差求一下最大值和最小值Coefficie nts 系數(shù)In terce pt截距Run Size 斜率 看一下P值(圖中Residual sta ndardMulti pie R-squaredAdjusted R-squaredpr的值)有三個*,代表顯著(比較好)標(biāo)

6、準(zhǔn)差(越小越好)(自由度,樣本數(shù)-參數(shù)=自由度) 代表R平方(越趨向于1越好)調(diào)整的R平方值(考慮自由度)F-statistic ( F檢驗)對整個式子進行檢驗p-value: 1.615e-06 小于 0.05 代表顯著T檢驗用來檢驗各個參數(shù)的顯著性F檢驗用來檢驗整個回歸關(guān)系的顯著性擬合殘差圖是拋物線形狀,那么需要二次項99.9%。二次項在P<0.001水平下,回歸系數(shù)都非常顯著。模型的方差結(jié)實率已經(jīng)增加到了 的顯著性(t=13.89, p<0.001)表明包含二次項提高了模型的擬合度。邏輯斯蒂回歸P = py =Xj = 1 + 兇祁嚴(yán)十亠丫 汁丫=1就是這個式子,y=0是1減

7、去這個式子這個式子計算丫取1的概率,式子結(jié)果>0.5取1,反之,取0 訓(xùn)練集,訓(xùn)練一個模型測試集,測試訓(xùn)練集的模型glm ()廣義線性模型model <- gimformula = chur n - ., data =tra in, family = 'bino mial') summary(model)因變量churn,自變量.,表示所有自變量3、聚類思想:聚類分析指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。流程:數(shù)據(jù)要滿足:高類聚,低耦合歐拉距離(兩點之間)曼哈頓距離(每一維度)明考斯基距離劃

8、分聚類:聚類算法 k-mea ns不存在三個中心點選距離作為數(shù)據(jù)樣本間相似性度量選擇評價聚類性能的準(zhǔn)則函數(shù)組間聚類越大,聚類越好K-中心點聚類存在的三個中心點 層次聚類group _k3=cutree(fit_hc,k=3)分成3類"str(as.de ndrogram(fit_hc)文本的形式打印這棵樹sapply(uniq ue(gro up _k3),fu ncti on( g)co un tries$co un trygroup_k3=g)查看k=3的聚類結(jié)果中各類別樣本4、關(guān)聯(lián)規(guī)則思想:關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。流程:關(guān)聯(lián)規(guī)則可以用兩個指標(biāo)來判

9、定:支持度與可信度X商品交易量/總的交易量同時包含 X Y的交易量/包含X的交易量支持度:可信度: 提升度:XY可信度/Y支持度(>1比較好)只有支持度和可信度較高的關(guān)聯(lián)規(guī)則才是用戶感興趣的。關(guān)聯(lián)規(guī)則挖掘主要有兩個問題:(支持度不小1. 找出交易數(shù)據(jù)庫中所有大于或等于用戶指定的最小支持度的頻繁項集。于最小支持閾值的項集稱為頻繁集)2. 利用頻繁項集生成所需要的關(guān)聯(lián)規(guī)則,根據(jù)用戶設(shè)定的最小可信度篩選出強關(guān)聯(lián)規(guī) 貝農(nóng)關(guān)聯(lián)規(guī)則的操作過程:ap riori函數(shù)先計算出支持度與可信度,然后運用ap riori關(guān)聯(lián)算法函數(shù)調(diào)用p arameter=list(s upp ort=0.006,con f

10、ide nee = 0.25,groceryrules = ap riori(groceries,min le n = 2)可視化顯示5、分類思想:決策樹顧名思義就是以建立一個樹形結(jié)構(gòu)模型,通過一系列規(guī)則對數(shù)據(jù)進行分類的過程。決策樹采用遞歸分類的方式,一步步的把數(shù)據(jù)分成子集( divide and con quer)。從根節(jié)點開始,算法會選擇一個最能預(yù)測目標(biāo)類的屬性來把數(shù)據(jù)分成多個子集,由此形成了幾個樹的分支,接下來算法再對每個分支進行遞歸處理,繼續(xù)選擇最適合的屬性來進行分類,直到滿足:+剩下的樣本都是同一類或者+沒有備選屬性了+樹已經(jīng)達到了預(yù)先定義的大小限制 6、主成分因子分析主成分(數(shù)據(jù)降

11、維):主成分分析(PCA是一種數(shù)據(jù)降維技巧,它能將大量相關(guān)變量轉(zhuǎn)化為 一組很少的不相關(guān)變量,這些無關(guān)變量稱為主成分。小a因戶片析KI辛圖屮展叫規(guī)測啞駅(Ml列X" 主成分因子分析(發(fā)現(xiàn)潛在結(jié)構(gòu)):因子分析(EFA是一系列用來發(fā)現(xiàn)一組變量的潛在結(jié)構(gòu)的方法。 它通過尋找一組更小的、潛在的或隱藏的結(jié)構(gòu)來解釋已觀測到的、顯式的變量間的關(guān)系。圖M-l(ai)析榷33主慮分分析*11網(wǎng)子分析僅蠻,(pvr PC2 > , (fIh F2 )和仏】列主要分析步驟:(1)數(shù)據(jù)預(yù)處理。(2)(3)(4)選擇因子模型。判斷要選擇的主成分 / 因子數(shù)目。 選擇主成分 / 因子。(5) 旋轉(zhuǎn)主成分 /

12、 因子。 主成分旋轉(zhuǎn):正交旋轉(zhuǎn)(使選擇的成分保持不相關(guān))與斜交旋轉(zhuǎn)(使選擇的成分變得相 關(guān))(6) 解釋結(jié)果。(7) 計算主成分或因子得分。PCA中需要多少個主成分根據(jù)先驗經(jīng)驗和理論知識判斷主成分?jǐn)?shù); 根據(jù)要解釋變量方差的積累值的閾值來判斷需要的主成分?jǐn)?shù); 通過檢查變量間k X k的相關(guān)系數(shù)矩陣來判斷保留的主成分?jǐn)?shù)。Cattell 碎石檢驗則繪制了特征值與主成分?jǐn)?shù)的圖形。這類圖形可以清晰地展示圖形彎曲狀況,在圖形變化最大處之上的主成分都可保留。最后, 你還可以進行模擬, 依據(jù)與初始矩陣相同大小的隨機數(shù)據(jù)矩陣來判斷要提取的特征值。若基于真實數(shù)據(jù)的某個特征值大于一組隨機數(shù)據(jù)矩陣相應(yīng)的平均特征值,

13、那么該主成分可以保留。代碼生成圖形見圖 14-2,展示了基于觀測特征值的碎石檢驗(由線段和 x 符號組成) 、根 據(jù) 100 個隨機數(shù)據(jù)矩陣推導(dǎo)出來的特征值均值(虛線) ,以及大于 1 的特征值準(zhǔn)則( y=1 的 水平線)。之前已經(jīng)介紹過, principal() 函數(shù)可以根據(jù)原始數(shù)據(jù)矩陣或者相關(guān)系數(shù)矩陣做主成分分 析。格式為:其中:r 是相關(guān)系數(shù)矩陣或原始數(shù)據(jù)矩陣;nfactors 設(shè)定主成分?jǐn)?shù)(默認(rèn)為1);rotate 指定旋轉(zhuǎn)的方法 默認(rèn)最大方差旋轉(zhuǎn)( varimax ),見 14.2.3 節(jié) 。scores 設(shè)定是否需要計算主成分得分(默認(rèn)不需要) 。02810Scree plot w

14、ith parallel anafysis6y - JI o46I'actor Number1、選主成分?jǐn)?shù)目Scrstn plot with pdrilhl ar>alytitMS扣忡證a亢于誕祁pwjb氓»Oanntnl humbflir有幾個差代表幾個特征值 紅色虛線代表隨機矩組的平均值 紅線,代表特征值為1的2、提取主成分principal ()函數(shù)可根據(jù)原始數(shù)據(jù)矩陣或相關(guān)系數(shù)矩陣做主成分分析u2 = 1- h2SS loadi ngs行包含了主成分相關(guān)聯(lián)的特征值,指的是與特定主成分相關(guān)聯(lián)的標(biāo)準(zhǔn)化后的方差值。Prop ortio n Var 0.923、主成分旋轉(zhuǎn)方差極大旋轉(zhuǎn)4、獲取主成分得分利用 principal()函數(shù),很容易獲得每個調(diào)查對象在該主成分上的得分。5、探索性因子分析Scree plots with parallel analysisT PC Actual DataPC Simulated DataFA Actual DataFA Simulated DataFactor/Component Number大于0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論