




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、本科畢業論文秦皇島農業發展狀況統計分析張鵬燕 山 大 學2015年 06月 本科畢業論文秦皇島農業發展狀況統計分析學 院: 理學院 專 業: 統計學 學生 姓名: 張 鵬 學 號: 1101020051 指導 教師: 吳俊波 答辯 日期: 2014/06/27 燕山大學畢業設計(論文)任務書學院:理學院 系級教學單位:統計學系 學號110108020051學生姓名張鵬專 業班 級11級數理統計題目題目名稱秦皇島市農業發展狀況統計分析題目性質1.理工類:工程設計 ( );工程技術實驗研究型( );理論研究型( );計算機軟件型( );綜合型( )。2.文管類( );3.外語類( );4.藝術類(
2、 )。題目類型1.畢業設計( ) 2.論文()題目來源科研課題( ) 生產實際( )自選題目() 主要內容1搜集秦皇島市各糧食總產量、農業總產值、耕地面積、農民人均純收入等指標數據,建立指標體系;2. 運用統計分析方法以及SAS軟件,對數據進行統計分析;3. 對結果進行分析,對秦皇島市農業發展狀況得出精確的結論,并給出合理提升研究建議。基本要求1. 能夠圍繞選題獨立查找文獻,搜集資料,整理資料,能正確理解、翻譯外文文獻;2學會用所學的統計分析知識和相關軟件去解決實際問題,提高解決問題、分析問題的能力;3. 認真分析數據,撰寫符合學校規定要求和格式的論文;4. 按計劃圓滿完成畢業論文任務。參考資
3、料1 李子奈,潘文卿.計量經濟學.北京:高等教育出版社2 張曉冉.統計分析及其SAS實現.北京:清華大學出版社周 次35周613周1415周1617周應完成的內容查閱資料,確定課題內容,了解目前課題的發展和應用情況,撰寫并提交開題報告。整理資料,學習搜集到的相關文獻資料。搜集數據,學習相關統計方法,撰寫論文初稿檢查論文初稿,修改畢業論文,整理并打印論文整理論文的寫作思路,準備答辯指導教師:吳俊波職稱:講師 2015 年 3月 14 日系級教學單位審批: 年 月 日摘要本文對從農業發展效率的角度對秦皇島的農業發展狀況進行統計分析。首先介紹了農業發展以及發展效率的基本概念,并且著重介紹了影響農業發
4、展效益的影響因素。然后介紹了主成分分析和數據包絡分析的理論基礎和使用方法。接著確立了評價指標體系,并將指標體系分為輸入指標和輸出指標兩類。然后,分別對輸入和輸出指標的數據通過SAS軟件進行主成分分析方法的處理和分析,對兩個指標體系進行了降維。在此基礎上采用數據包絡分析(DEA)的方法,通過DEAP軟件對通過主成分分析法處理后的輸入和輸出指標數據進行了計算,得到了秦皇島從2010年到2014年期間,農業發展的綜合效率、純技術效率和規模效率,并根據數據結果秦皇島的農業發展狀況進行了分析。最后,提出了針對秦皇島農業發展的若干建議。關鍵詞 農業發展;主成分分析;SAS;數據包絡分析AbstractTh
5、is paper analyzes the agricultural development of Qinhuangdao from the perspective of agricultural development efficiency. Firstly, the basic concepts of agricultural development as well as the development efficiency are introduced, and the factors that affect the agricultural development benefit ar
6、e introduced. Then, the theoretical basis and the method of using principal component analysis and data envelopment analysis are introduced. Then, the evaluation index system is established, and the index system is divided into two categories: the input index and the output index. The
7、n, the data of the input and output indicators are processed and analyzed by SAS software, and the dimension of the two index systems is reduced. On the basis of data envelopment analysis (DEA) method, the deap software by principal component analysis method of input and output data were calculated,
8、 Qinhuangdao from 2010 to 2014 during the comprehensive efficiency of the agricultural development, pure technical efficiency and scale efficiency and according to the data of Qinhuangdao agricultural development were analyzed by means of. Finally, some suggestions for the development of agricu
9、lture in Qinhuangdao are put forward.Keywords Agricultural development;Principal component analysis;SAS;Data Envelopment Analysis 目 錄摘要IAbstractII第1章 緒論11.1 課題研究的背景和意義11.1.1 課題研究背景11.1.2 課題研究的意義21.2 課題的國內外研究現狀31.2.1 課題研究現狀陳述31.2.2 研究方法評述41.3 本文的主要內容和創新點5第2章 基礎知識72.1 農業發展基礎知識綜述72.1.1 農業發展效益的相關概念
10、72.1.2 農業發展狀況的影響因素72.2 相關統計學基礎知識綜述82.2.1 主成分分析基本知識82.2.2 主成分幾何解釋112.2.3 主成分的導出與計算步驟132.3 數據包絡分析基礎知識綜述182.3.1 數據包絡分析簡介182.3.1 數據包絡分析理論介紹模型192.4 本章小結21第3章 秦皇島農業發展狀況綜合評價分析223.1 農業發展效益評價的指標體系確立223.2 主成分分析法對秦皇島農業發展效益評價指標的分析243.2.1 數據的來源及處理243.2.2 利用主成分分析法的分析過程243.2.2.1 輸入指標的主成分實例分析243.2.2.2 輸出指標的主成分分析273
11、.3 數據包絡分析法對秦皇島農業發展狀況效益評價的分析293.3.1 基于包絡分析方法的農業發展狀況效益數值計算293.3.2 秦皇島農業發展狀況效益綜合評價分析303.4 對秦皇島農業發展的若干建議323.5 本章小結33結論34參考文獻35致謝37附錄1 開題報告38附錄2 原始數據和運行程序43第1章 緒論1.1 課題研究的背景和意義1.1.1 課題研究背景 建國之后,中國一直在把農業發展看做重中之重,并在農業的發展上有著讓世界震驚的成就。中國的人數增長巨大,現如今已是13億多人數的國家,但農業的發展遠遠超過了人口數量上的增長,保證了人們的食物充足和各項基本需求。1949年建國之后,我國
12、當時的糧食總量是1億多噸,到1998年時增長了4倍之多,糧食總數的凈增長超過4億噸,平均每年增長超過8萬噸。中國的耕地面積占世界的百分之十,但卻用這些耕地養活了世界百分之五的人口,可以說是個奇跡。從數據來看,我國從1985年之后,總體上處于農產品的凈出口國,再到1995年之后,我國糧食也處于凈出口狀態1。在整個國家的農業發展一片大好前景的同時,秦皇島市的農業發展狀況也處于一個比較高的增長狀態。 2013年,農業生產形勢良好。積極施行“做精農業”整體方針,加大力度增加效益、增強基礎、穩定生產、提高素質,整個秦皇島的農業發展狀況取得一個非常好的勢頭。整個年份農產品總價值達305.53億元,超過20
13、12年4.4個百分點。農作物長勢良好,取得豐收,這是因為2013年雨水充沛,適宜農作物的生長。另一個原因是2012年發生了水災,使得糧食產量不高,基數比較低使得2013年糧食產量增長率很高,2013年整年的糧食總產量超過84萬噸。但是在接下來的一年降雨非常少,干旱的天氣影響到了農作物的生長,但秦皇島依然穩定了農業的增長,農業發展依舊略有提高。整個秦皇島的農業總價值315億元,仍然能較之去年增長3.8個百分點。此年秦皇島市糧食農作物耕種面積147518公頃,較之去年略有增長,提高了不到一個百分點。糧食農作物產量85萬余噸,較之去年增加0.89萬噸,增長1.1個百分點。然而,我們也應該看到,經過多
14、年的生產和積累,秦皇島市的農業發展有了一定的基礎,但由于耕作水平不高,科技含量低,使得農業投入產出的比率比較低2。農業發展結構的進一步完善,使本地的農業發展優勢體現出來,不適合農業發展方面的因素積極回避,才能使農業發展更上一層樓,這才是秦皇島積極去發展農業任務中的重中之重 3。1.1.2 課題研究的意義 農業的發展才能使農民生活條件改善,才能保證社會各個行業能協調、同步、快速的進步發展,保證人們的生活水平提高,社會結構更科學、合理,保證社會的治安穩定。隨之而來的,是全國人民的共享社會發展帶來的實惠。目前來看,各個行業正朝著科學化和現代化發展,農業發展也應該跟緊這個趨勢。農業發展的現代化能夠促使
15、城鎮化、工業化、現代化加快速度。當今的第二產業結構里,很多輕工業用農產品作為原材料,在食品加工和制造行業更是建立在農產品的基礎上。所以要實現社會的工業化,就必須加快農業發展,積極實現現代化,并且對農產品的加工更深一步,增加農產品的內在價值。因此可見,很多行業的發展是依靠農業的發展來作為基礎的。最近幾年秦皇島農業發展的整體勢頭良好,加大力度增加效益、增強基礎、穩定生產、提高素質,整個秦皇島的農業發展狀況取得一個非常好的進步。然而,我們也應該看到,經過多年的努力發展,秦皇島市的農業狀況有了一定的成就,但受限于科技水平等,資源配置問題等等,秦皇島的農業還有一定缺陷,是可以經過結構調整,創造一個更好的
16、成就。因此,對秦皇島農業發展狀況進行準確的綜合評價分析,對于合理解決當前秦皇島農業發展問題具有指導性的意義。只有對秦皇島農業發展狀況進行統計、分析。做好評價分析工作,秦皇島的發展才能把握好目前深化改革的契機,做好短期與長期銜接上,選準突破口,推動各項改革順利進行4。利用結果科學的對農業結構進行合理的調整。有利于秦皇島農業向現代化、規模化和產業化方向發展,農民都變成專業農民,農戶都變成專業的現代化的專業大戶,農業營銷變為專業化營銷5。1.2 課題的國內外研究現狀1.2.1 課題研究現狀陳述在早期時候國外已經有對農業發展狀態的研究,開始階段是以經濟指標作為出發點進行的研究 6。最開始時是農業發展動
17、態理論,是由政治經濟學家李嘉圖提出的,這一套理論肯定了農業新技術和農業資源的積累在農業發展中的作用。農業的進一步發展,是建立在土地的獲得或者其他農業發展資料的獲得的基礎上的。在李嘉圖之后,科克倫和約翰遜用了很長時間研究出農業技術傳播與利用體系理論,表明每次有關農業的新技術被發明之后,農民的生產能力以及農業資源的使用效率都有一個質的提高,并且這種農業新技術會進一步在各個部門傳播并且受到價格因素的影響;之后比較著名的理論是資源替代和誘導技術變革理論,是由日本的熊熊次郎和美國的拉坦共同發明的,主要表明農業技術的變更導致農業發展以不同的方式進一步發展。最后是錢納里發明了農業結構變化增長理論,證明了農業
18、結構的調整和轉變會影響農業發展,使得農業對勞動力的依賴減小,并且使農產品生產效率提高,農業資源、農業新發明的利用率進一步提高7。國內也緊跟國際形勢積極進行著農業發展的研究,主要都是用數據進行的定量研究。首先尋找能反應農業問題的指標體系出發,我國農業科學研究院岳文濤等人積極分析和吸取國內外學者的研究成果,對農業發展水平有了深層次的了解,然后依據了中國以及世界的農業統計資料,選出了13個農業指標,用他們組成指標體系。然后以此體系為基礎,對1986年間中國以及世界的農業發展狀況進行了統計分析,得到了我國農業發展狀況在世界的水平的結論。然后廣東農業發展科學研究院中的“農業指標體系”課題研究小組發表了名
19、為農業水平指標體系的探討的文章,他們認為有19個指標對于農業發展有代表性,這19個指標分為三層,從不同層次評析農業發展狀況。相比較于岳文濤等人的指標體系,這個指標體系將中國的農業現代化發展進程劃分為兩個階段,即初步發展現代化和基本實現現代化階段,兩個階段有兩套不同的指標體系,這也展現了中國農業發展由原始向現代化轉變的進程 8。隨后南開大學趙美玲從農業的本質和特征進行了分析,遵守中國農業的發展特征和一般規律,并且從中國實際情況出發,提出了更有針對性的中國農業評價體系指標。她把指標體系分為3個層級。其中一級指標包括,支持保障水平,要素投入水平,可持續發展水平和生產水平。二級指標有10個,三級指標有
20、30個9。在我國,農業發展狀況評價分析研究已經得到了政府和學術界的重視,為了適應國際上發展戰略觀的轉變和基于對我國30多年農業發展實踐的經驗和教訓的重新反思,涌現了大量研究成果。主要有一下方法:(1) 因素分析法這種方法把所有指標分為變數和不變數。其中幾個指標之間相互有相關性的指標是變數,沒有和其他指標相互影響的是不變數。然后把每一個指標做一個替換,其他指標不變,根據對結果的影響程度來判斷指標對結果的影響程度。通過對每一個指標的替換,就能從所有指標中找出主要影響的指標和次要影響的指標,確定了指標的影響程度,就可以有的放矢的對農業結構進行調整。 (2) 結構分析法這種方法也可以叫做比重分析法,顧
21、名思義,他是依靠分析每一個指標在結果中占的比重,剖析結果構成的變化,依次來確定主要影響因素和次要影響因素。用結構分析法分析問題時,了解事物發展的本質和內涵,可以對進一步解讀事物的發展趨勢有很大的幫助。(3)動態分析法這種方法是把所有指標分門別類,然后在每一段時間內對各個指標的數值進行比較,所以能從指標的變化分析出其變化的趨勢和速度。例如,把某一年的其中一個指標假定為100,然后把以后每年的數值以這一年為基準進行換算成具體數值,此時就可以很容易看出這項指標在幾年內的變化情況。 1.2.2 研究方法評述通過之前對國內外研究現狀的陳述,可總結出,在農業發展狀況統計分析這個問題的研究上存在很多種方法,
22、各種方法都有其優勢??傮w發展趨勢是由單一指標向多一指標,定性分析向定量分析,過度關注農業發展速度和產量的單一影響因素的角度向著經濟,環境,可持續水平等多元轉變。在分析評價方法上,指標體系涉及的指標眾多,能夠全方面的刻畫區域農業發展的特征。但是,每一項指標對農業發展的情況能反應的方面是不一樣的,對結果的影響程度也不一樣,由于指標太多,就很難明顯看出其中某一項指標的影響程度大小,這對評價農業發展狀況是不利的。國外學者比較關心社會因素,如健康、綠色、可持續性等指標,并且對環境也比較注重,比如綠化、水土、空氣質量等。國內在對農業發展評價上,雖然擺脫了把糧食總產量和速度作為農業發展評價的唯一標準,引入了
23、結構、社會、環境等因素,但總體來說,農業經濟指標還是評價農業發展水平的核心。指標眾多,怎么才能從這些指標中找出最為關鍵的指標呢。國內外有兩種常用的方法:一種是憑主觀上的經驗,對指標進行加權,如AHP法等10;另一種可以使用SAS等數學工具,計算指標之間的相關性,如聚類分析法、因子分析法、主成分分析法等。這些分析工具在經濟效益評價上是最常用到的。本文應用 DEA 方法探討從多個角度分析秦皇島農業發展狀況,并對秦皇島農業發展所出現的問題進行了分析并給出相應的建議。1.3 本文的主要內容和創新點本文通過對傳統的農業發展狀況分析的指標體系進行優化,確立了新的分析指標體系。并從經濟績效的角度,將所有的指
24、標進行了分類,分為輸入指標和輸出指標。然后,通過多元統計知識中的主成分分析分別對輸入和輸出指標進行了降維。最后,運用數據包絡分析的方法對輸入和輸出指標進行了計算,最終從農業發展效率角度,對秦皇島農業發展狀況進行綜合評價分析并對秦皇島農業發展給出了若干建議。本文的主要創新點在于:(1)對傳統評價指標體系進行了完善,在保留原有經濟發展速度和產量的基礎上增加了環境和可持續性等投入因素,并對應的增加了輸出指標。(2)農業效益的評價分析可以從很多角度來進行,本文是從經濟績效的角度來進行的分析的 第2章 基礎知識2.1 農業發展基礎知識綜述 2.1.1 農業發展效益的相關概念只要是經濟活動,都應該能夠用經
25、濟效益來測評,這也是最基本最可靠的指標。農業的經濟效益,是農業生產效率的一種體現,是農業總產值與農業總成本的倍數關系。用公式表示:農業經濟效益=農業總產值/農業總成本。經濟效率是經濟學理論研究的一個重心。農業經濟效益是經濟效率中的一個分支。農業發展包括的內涵廣泛,經濟因素、社會因素、環境因素都是其子系統,可以視為區域農業經濟系統是一個大的投入產出整體,農業發展的投入包括經濟投入、社會發展的投入、生態環境保護的投入等等,相應的產出則囊括了經濟增長、經濟結構優化、社會發展、生態環境改善等方面11。區域農業發展問題實質是將投入資源進行合理有效配置的過程。于是區域農業發展績效概念可以定義如下:區域農業
26、發展過程中,農業發展產出相對于農業發展的投入的有效程度,反映投入資源利用有效性的程度。農業發展有效是指在保持資源投入不變的情況下,已經獲得了最大的產出12。而本文是從經濟績效的角度對農業發展效益進行的量化分析,并以秦皇島為例進行了實際的分析,從而完成對秦皇島農業發展狀況的綜合評價分析。2.1.2 農業發展狀況的影響因素農業發展狀況主要受以下幾方面的因素的影響:(1)農業生產力水平。農業的生產力水平,決定著整個農業的產出能力。如果在相同的其他要素的投入水平下,生產力水平越高,更能產生更多的產出,說明農業發展狀況好。反正若其他經濟條件不變,相同的投入卻獲得更少的產出,則農業發展效益必然不佳。如今隨
27、著科技的發展,管理水平的提高,農業生產的專業化、機械化程度在很大程度上影響了農業生產力水平。(2)要素投入水平。從生產的角度講,要素的投入水平越高,則產出的越多。但要素的投入水平并不是和產出成正比的,要素投入水平符合邊際遞減規律,邊際遞減規律是指其他條件時,連續地增加生產要素的投入,所新增的產出或收益反而會逐漸減少。也就是說,生產要素應該投入的量有一個水準,如果超過了這個水準,繼續增加要素的投入不僅不會帶來總體產量的增加,反應會使總體產量下降。所以,要素的投入不是越多越好,和生產力相適應才是正確的。(3) 支持保障水平。政府對農業發展的支持和保障水平對農業發展狀況起著一定的影響作用。近年來,政
28、府從種糧免稅到種糧補貼,農機補貼等一系列舉措使更多的農民參與到來農業生產,促進著農業發展。(4) 可持續發展水平。這個因素要求我們合理使用資源,使用資源要從長遠角度考慮,保證資源的長期利用。所以我們應該從社會、資源、經濟、和環境保護等方面全面考慮問題。這是一套系統理論,保證我們既要著眼于現在的發展,又不能提前透支后代人的資源,兼顧環境的保護。這個觀念是一種立足現在和未來的思想。如今人們越發感覺到資源的過度利用和環境的破壞帶來的災難,環保和合理利用資源的理念已經植根于人們的腦海??沙掷m發展水平的高低,很大程度上影響了農業未來發展趨勢 13。四個因素之間均相互獨立,從不同的側面和角度影響和制約著農
29、業發展狀況的水平。2.2 相關統計學基礎知識綜述2.2.1 主成分分析基本知識(1)主成分分析的基本思想前面說到了如何從眾多指標中找出最關鍵的幾個,主成分分析法就是一種非常常用和實用的方法。通過主成分分析法,可以從眾多指標中提取出其中的“精華”,這些“精華”的幾個指標能解釋所有指標之間大部分的方差,也就代表這些“精華”包含了所有指標中大部分的信息,并且提取出的“精華”之間是沒有相關性的,從而做到了對指標的簡化。所以這種對眾多指標進行降維,提取出幾個能代表整體信息的、互相之間不相關的指標的方法叫做主成分分析方法。一般來說,處理降維這種問題的做法是用所有的變量做一個線性組合,把這幾個線性組合作為一
30、個新的變量,用新的數量較少的幾個變量去解釋所有方差,這樣,也能達到同樣的效果。但是這種方法存在一個問題,就是一組變量可以組成很多種新的變量組合。如果沒有其他限制條件,這種組合就會有很多,該如何從中選擇呢?現在假設所有指標組成的第一個新變量記為,我們盡可能的讓他能代表原變量更多的信息,這里所說的變量的“信息”也就是變量之間的方差,所以越大越是有利,說明能代表更多的原變量的信息。也這是這個原因,所以在第一個線性組合的選取時,應該從多個線性組合中挑選能代表最多信息的為,把叫做第一主成分。此時,這一個主成分可能不能代表原來個變量的方差,就需要再選取第二個線性組合,記為,使新的變量能更多的解釋更多的原來
31、的方差。我們的目的是對原眾多變量進行降維,所以希望中不包含中能夠解釋的方差,避免發生冗余。也就是要求盡可能的小,此時把叫做第二主成分,同樣用這種方法,就可以提取出第三、四第個主成分。(2)主成分分析的數學模型假設有一個個變量的樣本資料。觀測這些樣本的所有變量,個樣品的數據資料陣為: (2-1)其中:主成分分析的做法就是將這個變量,提取出其中的“精華”,變成一個新的數量少,而且互不相關的新的變量,即 (2-2)簡寫為: (2-3)模型應該滿足這些條件:互不相關(,),的方差依次減小 所以,這里把叫第一主成分,叫做第二主成分,按照這個順序,會出現第個主成分。我們把系數叫做主成分系數。這個模型用矩陣
32、表示如下:,其中 稱為主成分系數矩陣。主成分這一概念產生于19世紀初,是由Karl parson引用,開始時未了解決非隨機變量的問題。然而在1933年的時候Hotelling將這一方法或者說概念應用于隨機變量,從此以后主成分的應用越來越廣泛,對處理數據,分析問題起著越來越重要的作用,尤其在最近20年間,計算機數學軟件的大量使用,使得主成分分析操作變得簡單,應用也越來越多。主成分分析可以應用于許多領域,其中一個領域就是系統評估。系統評估是檢查一個理論系統是否處于正常的運營狀態很重要的一個環節,然后系統評估需要很多的指標,有些指標組成的變量數目巨大,難以處理。假如對一家企業的經濟效益進行系統評估,
33、很多指標都在影響著企業的經濟效益,所以指標變量也就很多,這些指標選取的標準就很難制定。所以解決系統評估問題的重點在于找到一種方法,能夠將大量的指標變量濃縮成很少或者說幾個變量,這樣,才能使系統評估有進行下去的先決條件在經濟研究領域,主成分依然有著很廣泛的應用,除了農業發展經濟效益的研究外,區域經濟發展水平的統計分析,區域發展競爭力的評估,人們的生活條件,生活質量的測評,等等很多問題都可以應用主成分分析進行研究。另外,主成分分析除了用于系統評估研究領域外,還在很多領域有極其重要的應用。本文主要是利用主成分分析的方法對影響農業發展的兩組指標進行一個濃縮,把多個變量變成少數變量。使新變量能體現原始數
34、據包含的信息,從而簡化計算,使問題清晰明朗。這樣,將這些處理數據后得到的主成分就可以作為數據包絡分析得決策和投入單元,從而減少因決策單元過多導致的計算誤差14。2.2.2 主成分幾何解釋要在二維空間中闡述主成分分析的幾何意義,需要假設有個樣本,每個樣本有二個指標變量。假設這個樣本在二維坐標軸中的分布是一個橢圓的形狀,如下圖所示:圖2-1 主成分幾何解釋圖現在對坐標軸進行一個角度為的正交旋轉,旋轉的數學公式為寫成矩陣形式為:其中為坐標旋轉變換矩陣,它是正交矩陣,即有,即滿足。這個橢圓在正交旋轉變換之后,就有了下圖所示的新坐標:圖2-2 主成分幾何解釋圖新坐標有如下性質:(1)個點的坐標和的相關幾
35、乎為零。(2)個點在坐標平面上的方差主要都集中在軸上,只有小部分的方差落在了軸上。和作為由原始的指標變量 和表示的新變量。并且這個點的方差是集中在軸上的,所以原二維坐標軸上的點用軸上的一個新的一維的坐標來表示,這樣就能保持原始點大部分的信息,所以把軸叫做第一主成分,軸與軸正交,他們之間的方差是最小的,所以把它叫做第二主成分。2.2.3 主成分的導出與計算步驟由上面建立的模型,我們可以了解主成分分析的內在含義和原理。要運用主成分分析,首先要有原始數據,并且滿足主成分分析數學模型的三個基本要求。如何利用主成分分析去解決問題,關鍵在于得出主成分系數,進而表示出主成分模型。1、由前面分析的主成分模型可
36、知,主成分之間應該沒有相關性,這是主成分模型的第一個條件。對于主成分,其協差陣應為,=2、將原始數據的協方差陣表示為,再對原始數據做標準化處理,此時協方差陣等于相關矩陣,即有:3、我們通過分析主成分的數學模型中的條件以及分析正交矩陣的性質,可得到,在滿足條件的前提下,最好是一個正交矩陣,即滿足于是,將原始數據的協方差代入主成分的協差陣公式得到下面的計算結果:展開上式得我們可以得到以下結果,這樣我們可以進行以后的分析找到了理論上的依據。對等號兩邊做一個展開的變換,變換之后矩陣仍然是相等的,我們可以從第一列中得出的方程:這是一個齊次方程,為了能夠順利得出解,他的系數矩陣的行列式必須是0,即此時,我
37、們就求出了相關系數矩陣的特征值,他對應的特征向量為。用同樣的方法對矩陣的第二列、第三列等進行展開、計算,就能得到的方程:的個根,特征方程的特征根是,他對應的其特征向量的分量為。4、下面再證明主成分的方差是依次遞減設相關系數陣的個特征根為,相應特征向量為。相對于的方差為:同樣有:,即主成分的方差依次遞減。并且協方差為: (2-4)由前面的證明可以知道,主成分分析中的協方差矩陣對角線上的元素正是原始數據相關矩陣的特征值,并且是一個對角矩陣,而與原始數據相關矩陣特征對應的特征向量組成了主成分系數矩陣的所有元素。矩陣是一個正交矩陣。可見,原變量在一系列的變換后成了一組新的變量新的隨機變量彼此不相關,且
38、方差依次遞減。樣本觀測數據矩陣為:第一步:對原始數據進行標準化處理。 其中 (2-5)第二步:計算樣本相關系數矩陣。為了說明更簡潔易懂,仍然用原來的來代表原始樣本數據在經過標準化后的矩陣,此時的原始數據在經過標準化變換之后其相關系數為: (2-6)第三步:求相關系數矩陣的特征值,相關矩陣由來表示,特征值用()來表示。在這里,我們可以用雅克比方法來進行計算。并能夠求出其對應的特征向量,用來表示。第四步:從中依次選取第一主成分,第二主成分等等,這些主成分的表達式都可以得到。此時我們能夠得到個主成分,再來觀察他們的方差,每個主成分的方差是逐漸減小的。這是因為這個原因,所以在處理實際問題時,并不是所有
39、得到的主成分都被拿來作為新的變量,一般做法是從中選取貢獻率比較大的前個主成分,并且這個主成分的累積貢獻率能達到一定標準。貢獻率是某一個主成分的方差與全部方差的比值,同樣也就是,某個主成分的特征值與全部主成分特征值總值的比值。用公式表示為:貢獻率=從貢獻率的定義和公式可以看出,貢獻率能代表某個主成分對原始數據所包含信息的解釋能力。在所有的個主成分之中選取個主成分,選取的個數的標準就是累積貢獻率的多少,一般來說,累積貢獻率處于85%以上的水平,新的變量就能夠解釋原始數據足夠說明情況的信息。在實際問題中,選取的所有主成分應該是有實際問題的意義的,我們對主成分的含義進行一個解釋,才能證明主成分具有的實
40、際意義。那么主成分的現實意義從何而來,如何對主成分做現實意義的解釋。一般的做法是,通過主成分表達式的系數可以獲得,并依此做一個大致的定性的分析。每一個主成分都是由原始變量以及加在前面的系數組成,這個系數有的大,有的小,有的正,有的負,都代表著原始變量對新變量的影響作用,或大或小,正相關或負相關。系數決定了原始變量對新的變量的影響程度和影響方向。如果所有的系數大小相差不大,就說明所有的變量對新變量的影響程度相差不大,可見這是一個體現綜合指標的新變量。然而每一個原始變量組合在一起形成的新的變量具體有什么現實意義,還要結合具體情境進行綜合的分析,這樣才能保證主成分分析結果的有效性和現實意義。第五步:
41、計算主成分得分。對原始數據進行標準化之后,每一個樣本一一對應代入到主成分表達式中,就能夠能到每一個主成分的在樣本數據下的具體值。所有主成分在每一個樣本下的具體值全部算出來,就得到了所有樣本在新變量下的新數據,即為主成分得分。數學語言可表示如下。第六步:主成分的主成分得分,是新變量在每一個樣本下的具體數值,并可以依靠這些數值對原變量進行統計分析??梢赃M行有主成份回歸,變量子集合的選擇,綜合評價等數據分析處理過程15。2.3 數據包絡分析基礎知識綜述2.3.1 數據包絡分析簡介本文對秦皇島農業發展狀況評價分析用到的分析工具是數據包絡分析(Data Envelopment Analysis),簡稱D
42、EA,其簡介如下。數據包絡分析是一種有效的效率評價方法,可以處理多投入和多產出的問題。可廣泛使用于效率評價。DEA追求投入要素的利用效率最大化,把一個投入要素的效率與另外一組提供相同效用的要素相比較,得出要素的使用效率。通過一系列計算,得到100%效率的投入要素是相對有效率單位,而另外的要素效率評分不足100%的要素是無效率單位。DEA方法有數學上的理論支持,與經濟學中的 Pareto 有效性相同,經過多次的處理實際問題的應用,證明他們都在處理效率評價問題時有著優良性能,分析結果要比生產函數更可靠。DEA處理后的結果并不是一個效率評價的絕對數值,而是一個相對數值,也就是說,經過DEA的處理,只
43、能得到是要素的相對有效性,在實際問題中,要素的相對有效要你實際有效更具有意義。在管理運籌學中經過理論和實際的研究,在一套生產系統中,任何生產效率不可能達到100%的最優使用。所以在實際生產中,只能找到最適合自己的,最滿意的生產效率。因而DEA成了效率評價問題方法中的有效方法,他可以給出合適生產環境發展方向、與現有生產水平相當的調整方向?,F在DEA 方法應經被很多領域所接受和認可,成為判斷、分析、決策生產效率和生產方向的一個重要輔助工具,實踐證明這種方法也是可靠的,很多文獻都對DEA的作用和優點進行了闡述,這里不再贅述。2.3.1 數據包絡分析理論介紹模型DEA在處理多投入多產出的問題上發揮著不
44、可替代的作用。在DEA方法中,會有很多的決策單位,每一個決策單元都有眾多輸入和輸出指標。通過分析每一個決策單元的輸入和輸出指標,可以得到每一個決策單元是否達到最優,這種最優并不是絕對的最優,而是相對于其他決策單元的最優。即結果反映的是一個決策單元相對于其他決策單元是有效的。DEA 方法擁有多個模型,其中模型應用最為廣泛,其概述如下:這里有個部門或單位,也就是決策單元,用DMU來表示。決策單元中有輸入指標和輸出指標,分別用和表示,他們都有具體的數值,由下表給出。我們引入實際的問題來對這個理論進行說明,輸入輸出指標中,有,對第種輸入的投入量,對第r種輸出的產出量。表2-1 決策單元的投入產出數據1
45、2n為方便,記對應的輸入、輸出數據分別為,其中,評價的DEA模型()為(分式規劃):這里面的,分別代表個輸入變量和個輸出變量的權系數。使用Charness和Cooper對于分式規劃的C-C變換,同時在非阿基米德域上引入非阿基米德無窮小的概念,給出了攝動法,這樣能將分式規劃問題轉變成與之等價的有非阿基米德無窮小量的DEA模型:其中:。為阿基米德無窮小量,是松弛變量,是剩余變量。在模型中,有效值指投入相對于產出的發揮其效用的程度,該決策單元的有效值用表示:數值高,代表資源的配置比較合理,如果值比較低,說資源存在著浪費,有沒有發揮其效用的部分。有效性判斷的標準為:(1)當,表示值DEA無效,決策單元
46、的輸入和輸出指標組成的生產系統中,能夠把原投入的數量按照比例的減少,而同時原產出不變。(2)當,和都大于0,表示為弱DEA有效,即在決策單元的輸入和輸出指標組成的生產系統中,投入要素減少的情況下還能保持產出不變,或者投入要素增加的情況下,產出增長的比例更高。(3)當,和均等于0,表示為DEA有效,即在決策單元的輸入和輸出指標組成的生產系統中,此時的資源使用水平達到最優,投入和產出都比較合理。DEA 方法是評價DMU要素使用相對有效性的有效辦法,同時能通過分析結果得到改善效率沒有達到最優的DMU的結構調整方向, DEA 方法還能夠對DMU的規模收益狀態進行有效評價。設,它的規模收益狀態能夠通過
47、k 值表示: (1)若 ,則的規模收益不變,也就是決策單元現在正是位于最大產出的規模點; (2)若,則處于規模收益是處于遞增狀態的,說明決策單元保持的投入量的同時,應當擴大投入量,這時候產出量會比投入量增加的比例更高; (3)若 ,則規模收益是處于遞減狀態的,說明決策單元保持的投入量的同時,這時候擴大投入的量,產出的量也會增加,但速率比投入要素增加的慢。 以上就是對 C2R 模型的介紹,這只是DEA方法中的一個模型。在進行實際的DEA操作之前,必須要先建立起輸入輸出指標體系。結合本文,首先必須建立秦皇島農業發展系統的輸入輸出指標,然后進行下一步分析。2.4 本章小結本章主要對本文在研究秦皇島農
48、業發展狀況的綜合評價分析時所用到的理論方法進行了闡述。其中包括農業發展經濟效益的知識綜述,多元統計分析中主成分方法的理論分析,以及數據包絡分析法。其中,數據包絡分析是本文主要的創新點,也是需要認真學習的知識。通過對理論的闡述,為下文中進行實例分析起到鋪墊的作用,也為下文中在如何處理數據的方法選擇上提供了理論支撐。第3章 秦皇島農業發展狀況綜合評價分析3.1 農業發展效益評價的指標體系確立DEA 方法中的輸入輸出指標并不是隨意構成的,而是有著自己的理論體系,同時也要符合構建的特殊準則。綜合國內外學者的使用心得,大致有以下特殊準則:第一,目的性。這些指標應該能夠說明評價對象的內在屬性,能夠從客觀的
49、角度反映評價的對象的運營情況。反過來,能對評價對象的運營情況有著一定反映能力的指標也都應該選取進來。這是評價結果有效的基本保障。第二,精簡性。要對決策單元做有效的評價,需要有一定數量的輸入和輸出指標,但如果指標過于多,這必會引起有效DMU 數量的增多,最終結果會使評價結果中有很多決策單元的效率值都趨近于1。從而降低了評價結果的說服性。所以輸入輸出指標應該在保證數目不太多的情況下適當選取。通常認為:輸入、輸出指標的總數應該在決策單元總數的三分之一以下,此時才能保證結果的可靠性。第三,關聯性。這就是要求輸入輸出指標之間應該有盡量少的相關性。輸入輸出指標應該有邏輯學上的聯系,但如果在數值上存在比較強
50、的線性相關性,就可以理解為輸入輸出指標之間互相包含著互相的信息,這樣會導致DEA最后的輸出結果有很多決策單元都是有效的。,因此應該保證輸入輸出指標之間的獨立性。第四,多樣性。要想充分展現評估對象的各方面運行情況,比較全面的指標體系是必不可少的,指標的多樣性,能反應不同的側面,保證結果的可靠性。本文構建秦皇島農業發展狀況綜合評價分析的輸入輸出指標體系的思路是:在傳統評價分析方法注重農業增長總量和速度研究的基礎上,突破傳統研究思維模式,綜合考慮了除經濟發展速度之外更多的因素,將經濟、社會和環境都納入評價中來。首先,輸入指標是從農業發展狀況的四大影響因素入手,選擇生產力水平,支持保障水平,可持續發展
51、水平和要素投入水平指標。我國區域農業發展輸出指標以經濟增長、社會發展、生態環境保護三大方面為基礎,對于秦皇島農業發展狀況的評價也不例外,同時考慮對秦皇島農業發展產生重要作用的環境因素和民生指標,以求全面科學地反映秦皇島發展效益的現實情況16。基于這樣的思路,參考國內外文獻篩選出引用率較高的指標,并結合秦皇島農業發展狀況實際,構成秦皇島農業發展效益綜合評價的指標如下:輸入指標包括:財政對農業的投入()、農業人員總數()、耕地總面積()、化肥施用量()、農業固定資產投資()、農村農戶投資()、造林面積()、有效灌溉面積(8)、零星植樹(X9)、育苗面積(X10)。輸出指標包括:農民人均純收入()、
52、糧食總產量()、農村消費品零售總額()、大牲畜年末存欄()、第一產業生產總值()、農業受災面積()。表3-1 農業發展效益綜合評價輸入輸出指標體系輸入指標變量單位輸出指標變量單位財政對農業的投入萬元農民人均純收入萬元農業人員總數人糧食總產量噸耕地總面積公頃農村消費品零售總額萬元化肥施用量噸大牲畜年末存欄白頭農業固定資產投資萬元農村居民家庭可支配收入萬元農村農戶投資萬元第一產業生產總值萬元造林面積公頃農業受災面積公頃有效灌溉面積公頃零星植樹萬株育苗面積公頃從構造的指標體系可以看出,輸入和輸出的指標數目過多,與前述的DEA方法指標的精簡性原則存在矛盾,因此在進行DEA方法分析之前,必須對輸入輸出指
53、標體系進行精簡,提取反映秦皇島農業發展效益的輸入輸出特征的核心信息。本文采用的是主成分分析法對指標體系進行降維來實現這個目的。3.2 主成分分析法對秦皇島農業發展效益評價指標的分析前面我們說到,主成分分析(Principal Component Analysis)的任務是把反映樣本某項特征的眾多指標變量簡化為少數的幾個新的綜合變量的多元統計方法。從上述指標體系中可以看出,無論從經濟學意義還是從數學角度分析很多指標或大或小的相關關系,然而,決策單元數目有限,這樣可能會造成DEA模型出現評價失效的情況。而且在處理實際問題時,過多的選取指標不僅會使研究過程變的更加困難,而且會導致問題更加復雜。主成分
54、分析方法是解決這一問題的較為理想的多元統計工具。針對于本文,主成分分析法的引入存在兩方面優勢:一方面,它能夠通過濃縮輸入輸出數據,保留其重要的信息,這些信息往往被認為能夠替代原來的指標,全面反映區域經濟發展水平,使研究結果更具可靠性,這樣縮減了指標,滿足 DEA 方法運算指標選擇的精簡性原則;另一方面,通過主成分分析法提取出來的因素之間是相互獨立的,消除了相關性17,這正滿足了 DEA 方法指標選擇的關聯性原則。3.2.1 數據的來源及處理本文中所用到的樣本數據是依據本文中建立的指標體系,搜集秦皇島2010年到2014年的各項指標數值。所有數據均來自于秦皇島統計局網站、河北省統計局網站和秦皇島政府工作報告。3.2.2 利用主成分分析法的分析過程現在,我們可以結合多元統計分析的理論知識,用SAS軟件進行主成分分析的編程。使用SAS軟件(SAS 9.3)對程序進行運行。提取到數據中“精華”的信息。結果如下:3.2.2.1 輸入指標
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧省朝陽市朝陽縣柳城高中2025年全國高三模擬考試(六)生物試題含解析
- 洛陽科技職業學院《專業技能訓練》2023-2024學年第二學期期末試卷
- 山東省棗莊市四十一中市級名校2024-2025學年初三一輪復習基礎知識檢測試題生物試題含解析
- 江蘇省鹽城市響水實驗、一中學2024-2025學年初三下學期第四次月考試卷化學試題含解析
- 寧夏大學《傳統人居文化研究》2023-2024學年第二學期期末試卷
- 上海民航職業技術學院《工程數值分析及實驗》2023-2024學年第一學期期末試卷
- 樂安縣2025年三年級數學第二學期期末復習檢測試題含解析
- 山東陽谷縣達標名校2024-2025學年初三一輪復習階段性考試(化學試題文)試題含解析
- 沈陽工程學院《商務英語視聽》2023-2024學年第二學期期末試卷
- 遼寧省沈陽市沈河區第八十二中學2025屆下學期期中考初三試卷物理試題含解析
- 妊娠滋養細胞疾病的護理課件
- JJF 1847-2020 電子天平校準規范(高清版)
- 《XX醫院安寧療護建設實施方案》
- 污水處理站運行維護管理方案
- 起重機械產品質量證明書與合格證樣表剖析
- 《機電傳動控制》模塊化實驗裝置設計
- 北師大版小學數學五年級上冊單元練習題全冊
- 職業病危害接觸史證明
- 苯嗪草酮生產工藝演示
- 用款申請單模板
- 外包商準入、退出管理制度
評論
0/150
提交評論