第1章統計和統計數據_第1頁
第1章統計和統計數據_第2頁
第1章統計和統計數據_第3頁
第1章統計和統計數據_第4頁
第1章統計和統計數據_第5頁
已閱讀5頁,還剩37頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

會計學1第1章統計和統計數據第1章統計和統計數據1.1

統計及其應用領域1.2怎樣獲得統計數據?第1頁/共42頁2008年8月學習目標統計學的含義統計學的研究內容統計的應用領域統計數據的類型獲得統計數據的途徑第2頁/共42頁2008年8月你相信這樣的一些統計結論嗎?吸煙對健康是有害的,吸香煙的男性減少壽命2250天不結婚的男性會減少壽命3500天,不結婚的女性會減少壽命1600天身體超重30%會使壽命減少1300天每天攝取500毫升維生素C,生命可延長6年身材高的父親,其子女的身高也較高二個出生的子女沒有第一個聰明,第三個出生的子女沒有第二個聰明,依此類推學生們在聽了莫扎特鋼琴曲10分鐘后的推理測試會比他們聽10分鐘娛樂磁帶或其他曲目做得更好上課坐在前面的學生平均考試分數比坐在后面的學生高第3頁/共42頁2008年8月不同原因引起的壽命損失原因天數原因天數未結婚(男性)3500飲酒130慣用左手3285槍炮事故11未結婚(女性)1600自然放射線830%超重1300醫療X-射線620%超重900咖啡6吸香煙(男性)2250口服避孕藥5吸香煙(女性)800減肥飲料2抽雪茄300家里有煙霧報警-10用煙斗抽煙絲220帶有氣囊的轎車-50危險工作,事故300移動冠狀動脈監護器-125一般工作,事故74注:負數表示壽命增加第4頁/共42頁2008年8月理解統計學對大眾的必要性與其他任何科學領域相比,社會公眾對統計學的理解是極為重要的(C.R.Rao)在外出旅游時,需要關心一段時間內的詳細天氣預報在投資股票時,需要了解股票市場價格的信息,了解某只特定股票的有關財務信息如果你關心足球世界杯,在有關媒體上,可以看到詳細的報道如果你關心宏觀經濟形式,在有關媒體上可以看到有關報道第5頁/共42頁2008年8月政治家或制定政策的人

理解統計學更重要政策制定者在作出決策時希望尋求技術指導,但他們自己在了解和解釋信息時所需的專業技術知識卻不足在政府或工業部門中工作的統計學者們常常與他們的上司產生語言上的障礙。一個統計辦公室的主管也是一個行政事務官,一次與一些統計學者開會,統計學者抱怨從其他部門收到的一些估計值沒有給出標準誤差(估計時的誤差大小,表示估計的精度),這個主管馬上問道:“對誤差也有標準嗎?”一個統計顧問提交給茶葉委員會的報告中,含有標題為“飲茶人數的估計值(含標準誤差)”的附表。不久,一封信被送到這個統計學者手中,問道什么是人們喝紅茶時的“標準誤差”皇家委員會審查一份統計報告,報告中提到中產階級家庭平均有2.2個子女,委員會評述說:“每一個成人女性有2.2個子女的數字是荒謬的。這是為了要求對中產階級提供財政援助以便通過四舍五入被平均值提高到一個更合適的整數第6頁/共42頁2008年8月政治家或制定政策的人

理解統計學更重要政策制定者在作出決策時希望尋求技術指導,但他們自己在了解和解釋信息時所需的專業技術知識卻不足健康大臣對一個統計學者的報告中提到的去年由于某種疾病,平均1000中死亡人數為3.2這個數字發生了興趣。他問他的私人秘書,3.2個人是如何死法?他的秘書說:“先生,當一個統計學家說死了3.2個人時,意味著3個人已經死了,兩個人正要死”第7頁/共42頁1.1統計及其應用領域

1.1.1統計學研究什么?

1.1.2統計的應用第1章統計和統計數據第8頁/共42頁1.1.1統計學研究什么?1.1統計及其應用領域第9頁/共42頁2008年8月什么是統計學?

(statistics)1.收集數據:取得數據2.處理數據:圖表展示分析數據:利用統計方法分析數據數據解釋:結果的說明得到結論:從數據分析中得出客觀結論收集、處理、分析、解釋數據并從數據中得出結論的科學

第10頁/共42頁2008年8月統計方法統計方法描述統計推斷統計參數估計假設檢驗第11頁/共42頁2008年8月描述統計

(descriptivestatistics)研究數據收集、整理和描述的統計學方法內容搜集數據整理數據展示數據描述性分析目的描述數據特征找出數據的基本規律02550Q1Q2Q3Q4¥x=30s2=105第12頁/共42頁2008年8月推斷統計

(inferentialstatistics)研究如何利用樣本數據來推斷總體特征的統計學方法內容參數估計假設檢驗目的對總體特征作出推斷樣本總體第13頁/共42頁2008年8月統計學研究什么?物理學研究的是如熱、光、電、運動規律那樣的自然現象化學家測定物質的組成及化學元素之間的交互作用生物學家研究植物和動物的生活數學家則在給出的假定之下沉溺于他自己推演各種命題的游戲這些學科中的每一門都有它自己的問題,而且有解決這些問題的各自的方法,各學科為此而成為一門單獨的學科第14頁/共42頁2008年8月統計學研究什么?統計學沒有任何固定的對象,是一門獨特的學問統計學研究的是來自各領域的數據,由解決其他領域內的問題而存在并興旺發達。按薩維奇(L.J.Savage)的說法:統計學基本上是寄生的??垦芯科渌I域內的工作而生存。這不是對統計學的輕視,這是因為對很多寄主來說,如果沒有寄生蟲就會死。對有的動物來說,如果沒有寄生蟲就不能消化它們的食物。因此,人類奮斗的很多領域,如果沒有統計學,雖然不會死亡,但一定會變得很弱第15頁/共42頁2008年8月統計學研究什么?統計學是一門科學統計學提供一套方法和技術,這些方法和技術不能用于固定模式,使用者在給定的情況下必須根據所掌握的專門知識選擇使用的方法,而且,如果需要還要進行必要的修正統計方法是通用的數據分析方法。這些方法不是為某個特定的問題領域而構造的統計學是一種技術如同工業生產過程中的質量控制程序一樣,統計方法是為保證產品達到所希望的質量和保持其穩定性的的管理系統中建立起來的統計方法也能用于控制、減少和考察不確定性統計學是一門藝術作為歸納推理的統計方法不是沒有爭議的。不同的人對同一組數據的分析可能得到不同的結論一本印度小說《紅色城堡》(TheRedFort)說:使用數字講故事取決于統計學家的技巧和他們的經驗。在這個意義下,統計學也是一門藝術第16頁/共42頁2008年8月統計是一種思維方式統計思維總有一天會像讀與寫一樣成為一個有效率公民的必備能力(H.G.Wells)在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數學;在理性的基礎上,所有的判斷都是統計學(C.R.Rao)第17頁/共42頁1.1.2統計的應用1.1統計及其應用領域第18頁/共42頁2008年8月統計的應用領域【例1.1】用統計識別作者

1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison為了說服紐約人認可憲法,匿名發表了著名的85篇論文。這些論文中的大多數作者已經得到了識別,但是,其中的12篇論文的作者身份引起了爭議通過對不同單詞的頻數進行統計分析,得出的結論是,JamesMadison最有可能是這12篇論文的作者?,F在,對于這些存在爭議的論文,認為JamesMadison是原創作者的說法占主導地位,而且幾乎可以肯定這種說法是正確第19頁/共42頁2008年8月統計的應用領域【例1.2】用簡單的描述統計量得到一個重要發現

費舍(R.A.Fisher)在1952的一篇文章中舉了一個例子,說明如何由基本的描述統計量的知識引出一個重要的發現。20世紀早期,哥本哈根卡爾堡實驗室的施密特(J.Schmidt)發現不同地區所捕獲的同種魚類的脊椎骨和鰓線的數量有很大不同;甚至在同一海灣內不同地點所捕獲的同種魚類,也發現這樣的傾向然而,鰻魚的脊椎骨的數量變化不大。施密特從歐洲各地、冰島、亞速爾群島以及尼羅河等幾乎分離的海域里所捕獲的鰻魚的樣本中,計算發現了幾乎一樣的均值和標準偏差值。由此,施密特推斷所有各個不同海域內的鰻魚是由海洋中某公共場所繁殖的。后來名為“戴納(Dana)”的科學考察船在一次遠征中發現了這個場所第20頁/共42頁2008年8月統計的應用領域【例1.3】挑戰者號航天飛機失事預測

1986年1月28日清晨,載有7名宇航員的挑戰者號進入發射狀態。就在發射前,有冰片牢附在機殼上。幾分鐘后,正當電視新聞報道它已進入軌道時,航天飛機在毀滅性的爆炸聲中化成碎片,機上的宇航員片骨未存推動航天飛機進入太空的兩個固體燃料發動機是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的經理們和國家航空航天局就如期發射還是推遲發射產生了爭執。天氣預報發射時的氣溫為310F。爭執的結果采納了Thiokol公司經理們的建議:按計劃發射航天飛機。因為他們覺得沒有確鑿證據表明低溫會對固體燃料火箭推進器的性能產生影響第21頁/共42頁2008年8月統計的應用領域【例1.3】挑戰者號航天飛機失事預測在此次失事前,該航天飛機24次發射成功。將航天飛機送入太空的兩個固體燃料推進器由6只O型項圈密封。在幾次飛行中,曾發生過O型項圈被腐蝕或氣體泄漏事故。這樣的事故是及其危險的。前24次發射中有一次發動機遭到了永久性破壞。根據23次飛行中發生腐蝕或泄漏事故的次數(因變量)及火箭連接處的溫度(自變量)數據,進行線性回歸得到的回歸方程為當溫度為310F時,O型項圈發生事故的預計次數為2.225次。結果顯示連接處的溫度與O型項圈事故之間有一定的相關性。如果當時那些經理們看到了回歸的預測結果,也許推遲發射會成為其謹慎的選擇第22頁/共42頁2008年8月統計的應用領域actuarialwork(精算)agriculture(農業)animalscience(動物學)anthropology(人類學)archaeology(考古學)auditing(審計學)crystallography(晶體學)demography(人口統計學)dentistry(牙醫學)ecology(生態學)econometrics(經濟計量學)education(教育學)electionforecastingandprojection(選舉預測和策劃)engineering(工程)epidemiology(流行病學)finance(金融)fisheriesresearch(水產漁業研究)gambling(賭博)genetics(遺傳學)geography(地理學)geology(地質學)historicalresearch(歷史研究)humangenetics(人類遺傳學)第23頁/共42頁2008年8月統計的應用領域hydrology(水文學)industry(工業)linguistics(語言學)literature(文學)manpowerplanning(勞動力計劃)managementscience(管理科學)marketing(市場營銷學)medicaldiagnosis(醫學診斷)meteorology(氣象學)militaryscience(軍事科學)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科學)pharmaceutics(制藥學)physics(物理學)politicalscience(政治學)psychology(心理學)psychophysics(心理物理學)qualitycontrol(質量控制)religiousstudies(宗教研究)sociology(社會學)surveysampling(調查抽樣)taxonomy(分類學)weathermodification(氣象改善)第24頁/共42頁2008年8月統計的誤用與濫用大約在一個世紀以前,政治家BenjaminDisraeli曾有一個著名的論斷:“有三類謊言:謊言、糟透的謊言和統計”。他還說:“圖并沒有說謊,是說謊者在畫圖”歷史學家AndrewLang說,一些人使用統計“就像喝醉酒的人使用街燈柱—支撐的功能多于照明”統計濫用不好的樣本過小的樣本誤導性圖表局部描述故意曲解第25頁/共42頁2008年8月統計的誤用與濫用統計應用上的兩個極端不用或幾乎不用統計簡單問題復雜化在統計應用中,這兩個極端都是不可取的簡單的方法不一定沒用,復雜的方法也不一定有用。正如有的學者所說的,最簡單的模型往往是最有用的統計應該恰當地應用到它能起作用的地方。不能把統計神秘化,更不能歪曲統計,把統計作為掩蓋實事的陷阱第26頁/共42頁1.2怎樣獲得統計數據

1.2.1變量與數據

1.2.2數據的來源第1章統計和統計數據第27頁/共42頁1.2.1變量與數據1.2怎樣獲得統計數據第28頁/共42頁2008年8月變量與數據變量(variable)從一次觀察到下一次觀察會出現不同結果的某種特征觀察一個企業的銷售額,這個月和上個月有所不同;觀察股票市場上漲股票的家數,今天與昨天數量不一樣;觀察一個班學生的生活費支出,一個人和另一個人不一樣;投擲一枚骰子觀察其出現的點數,這次投擲的結果和下一次也不一樣“企業銷售額”、“上漲股票的家數”、“生活費支出”、“投擲一枚骰子出現的點數”等就是變量數據(data)觀察到的變量的結果第29頁/共42頁2008年8月變量與數據定量變量(quantitativevariable)或數值變量(metricvariable)可以用阿拉伯數據來記錄其觀察結果如“企業銷售額”、“上漲股票的家數”、“生活費支出”、“投擲一枚骰子出現的點數”定量變量的觀察結果稱為定量數據或數值型數據(metricdata)分類變量(categoricalvariable)表現為不同的類別如“性別”、“企業所屬的行業”、“學生所在的學院”等分類變量的觀察結果就是分類數據(categoricaldata)順序變量(rankvariable)或有序分類變量具有一定順序的類別變量如考試成績按等級,一個人對事物的態度順序變量的觀察結果就是順序數據或有序分類數據(rankdata)分類變量和順序變量統稱為定性變量(qualitativevariable)第30頁/共42頁1.2.2數據的來源1.2怎樣獲得統計數據第31頁/共42頁2008年8月數據的來源尋找二手數據抽取樣本總體(population):包含所研究的全部個體(數據)的集合樣本(sample):從總體中抽取的一部分元素的集合樣本量(samplesize):構成樣本的元素的數目概率抽樣方法第32頁/共42頁2008年8月概率抽樣

(probabilitysampling)根據一個已知的概率來抽取樣本單位,也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率第33頁/共42頁2008年8月簡單隨機抽樣

(simplerandomsampling)從總體N個單位(元素)中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其他輔助信息以提高估計的效率第34頁/共42頁2008年8月簡單隨機樣本

(simpleran

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論