




已閱讀5頁,還剩74頁未讀, 繼續免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SASBASE,BY:PAean.won,Page2,目錄,第十章:SAS綜合運用舉例,Page3,第一章,SAS系統初識,Page4,SAS系統誕生,全稱為StatisticsAnalysisSystem,最早由北卡羅來納大學的兩位生物統計學研究生編制1972研制出第一版,1976年成立了SAS軟件研究所,正式推出了SAS軟件,現在是9.2版是用于數據分析與決策支持的大型集成信息系統,統計分析功能是它的重要組成部分和核心功能國際上的標準軟件系統,Page5,BASESAS模塊SAS/STAT-統計分析模塊SAS/ETS-經濟計量學和時間序列分析模塊SAS/OR-運籌學模塊SAS/QC-質量控制模塊SAS/IML-交互式矩陣程序設計語言模塊SAS/GRAPH-繪圖模塊SAS/FSP-快速數據交互式菜單系統模塊SAS/AF-交互式應用開發模塊SAS/ASSIT-菜單驅動界面模塊SAS/ACCESS-訪問外部數據模塊SAS/EIS-企業信息系統模塊SAS/INSIGHT-可視化探索工具模塊SAS/CALC-電子表格模塊SAS/CONNECT-分布式數據處理模塊SAS/WA-企業級數據倉庫管理模塊SAS/EM-企業級數據挖掘模塊,SAS功能模塊,Page6,SAS工作界面*-重要功能鍵:F1,F5,F6,F7,F9,CTL+E,SAS工作界面,Page7,SAS兩類菜單欄,菜單欄的下拉菜單操作:點菜單欄中的按鈕,彈出菜單操作:相應窗口點鼠標右鍵,Page8,SAS工具欄,資源管理器窗口工具欄,編輯器窗口工具欄,Page9,SAS命令,在命令行中輸入SAS命令可以快速完成一些SAS任務,Page10,SAS主要功能窗口,以“只顯示內容”視圖顯示的“SAS資源管理器”窗口(沒有樹視圖)“結果”窗口程序編輯器、增強型編輯器“日志”窗口“輸出”窗口“SAS資源管理器”窗口,Page11,SAS資源管理器窗口,SAS資源管理器窗口下,可以執行基本的SAS任務:1、創建新的邏輯庫和文件快捷方式;2、創建新的邏輯庫成員和目錄條目;3、打開和編輯SAS文件。,根據操作環境,可以使用以下方法打開“SAS資源管理器”窗口(打開樹視圖和列表視圖):1、菜單:查看=SAS資源管理器2、命令:EXPLORER3、工具欄:SAS資源管理器,Page12,SAS結果窗口,可以通過結果窗口對程序的輸出結果進行瀏覽和管理,1、SAS可以用一種或多種格式(或類型)產生輸出。2、默認類型是“列表”輸出(如右圖的“查詢結果”)。3、其他輸出類型包括HTML、“輸出數據集”和PostScript。,Page13,SAS輸出類型設置,要設置輸出類型,可使用菜單欄=工具=選項=參數選擇=“結果”標簽,進入參數選擇窗口進行設置如下圖所示。,點選創建HTML時,輸出結果同時展現在HTML文件中。,Page14,SAS增強型編輯器窗口,SAS9.1版本的默認編輯窗口為增強型。它比普通編輯窗口增加了如下功能:,使用特定顏色對SAS程序、SCL程序以及HTML和XML文件的元素進行顯示,同時進行相關語法檢查。創建和格式化自定義的關鍵詞。每個過程步、數據步或者宏的程序段都可以實現展開和收縮的功能,以便對SAS程序的宏觀結構有更好的了解。通過定義縮寫來快速輸入一段文字。通過顯示行號使得程序代碼更具可讀性。設定增強型編輯器的快捷功能鍵。同時打開一個文件的多個視圖。將光標停留在語言元素上,按F1就可以直接進入到SAS幫助文檔中該語言元素的說明部分,當然有時候該語言元素有多個主題,可以根據需要進行選擇。,Page15,SAS日志窗口,“日志”窗口用來查看程序運行信息:提交的程序語句;系統消息和錯誤;程序運行速度和時間。“日志”窗口中的元素根據以下類型呈現不同的顏色:程序行黑色:以語句標號開始;提示藍色:以NOTE開始;警告綠色:以WARNING開始;錯誤紅色:以ERROR開始。,Page16,SAS輸出窗口,按F8提交程序,SAS界面如下所示:,輸出窗口用來查看SAS程序的輸出結果,Page17,SAS新建邏輯庫,1、在邏輯庫級別,在空白處按右鍵,選擇新建,出現如下界面。2、在名稱中輸入新的邏輯庫名稱。3、在引擎中根據數據來源選擇不同的引擎,如果只是想建立本機地址上的一個普通的SAS數據集數據庫,可以選擇默認。4、然后點選啟動時啟用,在邏輯庫信息中,點選路徑后面的瀏覽按鈕,選擇與這個邏輯庫相對應的物理地址。選項窗口可以不填,點擊確定產生一個新的邏輯庫。,Page18,SAS程序編輯窗口操作,提交程序可以用增強型編輯器編寫程序,也可以將用其它文本編寫的程序拷貝到編輯器。程序完成后,直接按F3或者F8提交程序,或點選工具條中的提交按鈕,或者在命令框中輸入Submit命令。,儲存程序程序可以保存為其它格式的文本,也可以直接以編輯器的方式來儲存,直接點選文件=保存,選擇路徑就可以保存這些程序。,Page19,SAS數據集導入和導出,第一步:點選文件=導出數據,出現如下界面,要求輸入要導出文件的邏輯庫名稱和數據文件名稱,比如要導出sashelp邏輯庫的class數據文件,通過下拉菜單選擇邏輯庫和數據文件。,Page20,SAS數據集導入和導出,第二步:點選next,進入到選擇輸出格式界面。通過下拉菜單選擇給定的格式:MicrosoftExcel97,2000or2002workbook,然后點選next.,Page21,SAS數據集導入和導出,第三步:進入到設定輸出文件位置和名稱界面,通過瀏覽按鈕選擇輸出位置,并鍵入輸出文件的名稱,如E:test.xls.,Page22,SAS數據集導入和導出,第四步:點選ok,進入到SASExportWizard畫面,SASExportWizard和后面要介紹的ImportWizard是SAS轉換數據文件的工具。在這個畫面中,ExportWizard要求對這個輸出過程的table命名,這時可以直接選finish完成輸出,或者命名為1。,Page23,SAS數據集導入和導出,第五步:如果上一步選擇命名,SAS會建立一段與上述窗口操作相同的程序,并提示是否要保存這段程序。,SAS對數據的管理,1:SAS對數據的分析與呈現都是面對SAS數據集進行2:SAS數據集是一種SAS文件3:SAS文件是由SAS系統創建和管理的有特殊結構的文件。,Page25,SAS對外部數據的管理,數據直接輸入,流行的數據庫,其它文件格式,SAS數據集,SAS應用程序,數據分析過程中用得較少,數據挖掘過程中用得較多,常用的數據分析獲取外部數據,TXTEXCELCSVSPSS,ACCESS;DB2;ORACLE,Page26,SAS邏輯庫,26,SAS邏輯庫由一組SAS文件組成。SAS軟件系統的信息組織有兩層,第一層是SAS邏輯庫,第二層是SAS文件。SAS邏輯庫是一個邏輯概念,本身不是物理實體,它對應的實體是操作系統下一個文件夾或幾個文件夾中的一組SAS文件。SAS邏輯庫文件用兩級命名方式定名:libname.SAS-filename(庫標記.文件名),SAS數據集,SAS數據庫,SAS邏輯庫有永久庫和臨時庫兩種臨時庫:名為WORK,系統自動指定永久庫:系統自動指定名為SASUSER,(SASHELP等).其它可由用戶指定,Page27,SAS創建邏輯庫,邏輯庫名是SAS名,長度不能超過8個字節。如SAS邏輯庫:ResDat,SASHELP等。建立SAS邏輯庫的方法:用菜單操作;用LIBNAME語句。語句格式:LIBNAMElibrefSAS-data-library語法說明:Libref邏輯庫名SAS-data-library邏輯庫對應的物理地址Engine引擎名稱(缺失時為默認引擎),例1用LIBNAME語句創建SAS邏輯庫。libnamezkxrC:DocumentsandSettingsuser桌面中科信軟SAS培訓邏輯庫a;例2引用非臨時庫的SAS文件時必須使用兩級命名方式,而引用臨時庫的SAS文件時,可以直接使用文件名,效果等同于work.文件名。datazkxr.a;setd.v;run;,Page28,SAS語句,SAS語句就是一系列關鍵詞、SAS名稱、算符以及特殊字符的組合。所有的SAS語句以分號結尾。SAS語句一般分為數據步語句與過程步語句,以及可以用在SAS程序任何地方的全局通用語句。,KEYWORDparameteroptions;關鍵詞參數選項;其中:粗體-必須按顯示形式書寫的關鍵詞;白正體-用戶提供的信息;-括號內的信息可選;|-任選。參數PARAMETER不是任選項,不用括號,OPTIONS是選項關鍵詞。,Page29,SAS語名舉例,例2.5有效的SAS語句。datadata1;/*data為關鍵詞,data1為SAS名*/data_null_;/*_null_為SAS名*/putname$8.;/*put為關鍵詞,name為SAS名,$8.為輸出格式*/formatdateyymmdd10.;procmeansdata=ResDat.class;/*proc為關鍵詞,means為過程名*/infile“d:ResDatclass.txt”;doI=1to100;x=y+1;sumx+x;run;,Page30,SASoptions選項,系統選項用來控制SAS的運行方式,如SAS系統啟動,硬件軟件的連接,SAS程序的運行等。語句格式:OPTIONSoption(s);option設定一個或多個系統選項,任何系統選項都有一個默認設置。例:設定選項OPTIONSobs=5;/*取數據集前五個觀測*/Dataone;SetResDat.class;Run;,Page31,SAS表達式,表達式由一系列操作符和操作對象構成,產生一個目標值。使用表達式可以對變量作變換和賦值,創建新變量,計算新數值以及控制條件語句的運行等。操作對象有:變量;常數。,操作符包括:算術算符;比較算符;邏輯算符;SAS函數;括號。,Page32,SAS常數,SAS常數是SAS系統可以識別的一些固定值。,1.數值常數。1,5,1.23,1.2E23,2E4,20000數值常數可以有多種格式展示。標準格式:1,01,+1,-1,1.1;科學計數法:1.1e11,1.2e-12;十六進制格式:1cx,12x,9x,2.引用帶引號的字符常數。name=TOM”S;name=”TOMS”;/*例中,兩語句等價。*/要注意的是,字符常數是由引號括起來的,但是字符變量的名稱則沒有引號,也就是說字符常數不能作為字符變量的名稱。,3.引用日期時間常數。1jan2000d;01jan00d;9:25t;18jan00:9:27:25dtifbegin=01JAN2000dthenend=31DEC2000d;,Page33,SAS算符,SAS算符是一些符號,其作用是進行計算、比較等。,算術算符應用。data;X=3.5*2.5;putX=;Y=9+1/3;putY=;X=.;Y=1+X;putY=;/*Y也是缺失值*/run;,比較算符應用。ifx;CLASSvariable(s);FREQvariable;IDvariable(s);OUTPUT;TYPESrequest(s);VARvariable(s);WAYSlist;WEIGHTvariable;,Page60,SAS均值過程,Page61,PROCMEANS;option-list選項說明:,SAS均值過程,Page62,ORDER=選項及說明:VARDEF=選項及說明:,SAS均值過程,Page63,statistic-keyword-list選項就是均值過程可以計算的描述統計量。規定的關鍵詞可以分為三類:描述統計量關鍵詞;分位數關鍵詞;假設檢驗關鍵詞。,SAS均值過程,procmeansdata=s.regmaxdec=2meannmaxminrangestdalpha=.05clmfw=8;varwaitquit;classweek;outputout=amean=mean_wmean_qn=n_wn_qmax=max_wmax_qmin=min_wmin_qrange=range_wrange_qstd=std_wstd_q;run;,Page64,SAS單變量過程,單變量過程(UNIVARIATE)除了能計算均值過程的基本統計量外,還可以實現的計算和功能有:穩健性估計量;描述變量的分布圖;頻數表;多項檢驗。,PROCUNIVARIATE;BYvariable-1variable-n;CLASSvariable-1;FREQvariable;HISTOGRAM;IDvariable(s);INSET;OUTPUTstatistic-keyword-1=name(s);PROBPLOT;QQPLOT;VARvariable(s);WEIGHTvariable;,Page65,SAS,PROCUNIVARIATEDATA=SAS-datas-et;選項說明:VARDEF=選項及說明:,Page66,SAS應用單變量過程進行多變量分析,procunivariatedata=s.regfreqnormalplot;varwaitquit;classweek;outputout=testmean=mean_wmean_qstd=std_wstd_qpctlpts=255075pctlpre=ab;run;,Page67,SAS擬合密度曲線,第一步:創建一個數據集,隨機生成一列正態分布和指數分布數據.datadistrdata;dropn;labelnormal_x=NormalRandomVariableexponential_x=ExponentialRandomVariable;don=1to100;normal_x=10*rannor(53124)+50;exponential_x=ranexp(18746363);output;end;run;,Page68,SAS,procunivariatedata=distrdatanoprint;varNormal_x;histogramNormal_x/normal(color=yelloww=3midpercentsnoprint)cbarline=redcfill=green;insetnmaxminmeanstdnormal(ksdpval)/pos=neformat=6.3;title100ObsSampledfromaNormalDistribution;run;,Page69,SAS,procunivariatedata=distrdatanoprint;varExponential_x;histogram/exp(filll=3)cfill=yellowmidpoints=.05to5.55by.25;title100ObsSampledfromanExponentialDistribution;run;,Page70,SAS綜合運用舉例,第十章,Page71,目的:從同一個文件夾中批量導入結構相同的TXT文檔到邏輯庫,并合并為一個數據集。,SAS,/*第一步:用批量上傳的過程*/%macrodirectory(dir=);/*批量導入TXT文件數據臨時數據集,*/%letrs=%sysfunc(filename(filref,Page72,SAS,%macroappend(out=);proccont
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際貿易代理基礎知識考核試卷
- 珠寶首飾表面處理技術考核試卷
- 玻璃制品耐候性測試與優化考核試卷
- 稻谷種植農業氣象服務需求與供給考核試卷
- 新材料新技術引領可持續發展的新方向考核試卷
- 果蔬汁飲料的企業文化與品牌建設考核試卷
- 紡織企業成本分析與控制考核試卷
- 勞務派遣企業招聘渠道分析與優化考核試卷
- 濟南大學《模特經紀管理》2023-2024學年第二學期期末試卷
- 江西服裝學院《嬰幼兒護理與急救》2023-2024學年第二學期期末試卷
- 2023年湖南省中學生生物學奧林匹克競賽選拔賽試題及答案
- 升壓站建筑工程施工作業指導書
- GB/T 27548-2011移動式升降工作平臺安全規則、檢查、維護和操作
- GB/T 24825-2009LED模塊用直流或交流電子控制裝置性能要求
- 2023年湖南公務員面試真題及解析匯總
- 部編人教版語文九年級下冊《18天下第一樓》課件
- 2023年東莞市網格員招聘筆試題庫及答案解析
- 老舊小區改造要素設計課件
- 社交網絡分析
- 物業綠化養護方案綠化管理方案
- 2022年平涼市第二人民醫院醫護人員招聘筆試試題及答案解析
評論
0/150
提交評論