




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章統計數據收集、整理與顯示1主要內容2.1統計數據的收集2.2統計數據的整理2.3統計數據的顯示——統計表和統計圖2統計數據是通過統計實踐活動所獲得的能夠說明現象總體的屬性或數量表象或內在關系的表現,是統計實踐活動的成果。3統計數據的種類按是否可以直接用數字表示,分為定性數據和定量數據按是否經過加工處理,分為原始數據和綜合數據按時間狀況,分為截面數據和時序數據4定性數據—說明事物的品質特征的,不能用數值表示,其結果通常表現為類別。定量數據—說明事物的數量特征,是用數值來表示的,其結果表現為具體的數字。原始數據—說明總體單位特征的數據,主要產生于統計調查階段。也稱為標志值。綜合數據—說明總體數量特征的數據,主要產生于統計整理和分析階段。截面數據—是同一時間點或時間段的數據時序數據—是不同時間點或時間段的數據
5§2.1統計數據的收集
一、原始數據的收集統計數據收集是根據統計研究的目的要求,采用科學的形式和方法,有計劃、有組織地獲取所研究變量數據的過程。在社會經濟統計中,統計數據收集也稱為統計調查。它是進行統計數據整理和分析的必要前提。對統計數據收集的基本要求:準確性、及時性。6統計數據的分類按照獲取途徑不同,統計數據可以分為直接來源的原始數據和間接來源的次級數據。原始數據是直接對各調查單位進行觀察登記或通過實驗來收集的數據。次級數據亦稱二手數據,是從統計年鑒、報刊、互聯網或有關部門業務資料中獲取經過加工整理的數據。71.統計調查的組織形式8就范圍不同劃分而言全面調查:對調查對象中的所有單位無一例外地進行調查。直接獲得總體數據。優點:資料齊全、能夠滿足各級政府領導管理需要;不存在代表性誤差。缺點:耗費大,易產生登記性誤差。應用:搜集重要的、基礎性數據。非全面調查:對調查對象中的一部分進行調查。獲得樣本數據。優點:耗費小(人財物時間),不易產生登記性誤差。缺點:存在代表性誤差。應用:廣泛。9(1)統計報表統計報表是以基層單位的原始記錄為依據,按國家有關法規的規定,自上而下地統一布置任務,按統一的表式、統一的項目、保守時間和程序,自下而上地定期提供基本統計資料的一種調查方式。
統計報表的種類
按報送周期:日報、旬報、月報、年報、年報 按調查范圍:全面統計報表和非全面統計報表
特點
是國家重要的定期統計報告制度; 自上而下統一布置,自下而上定期提供; 費時、費力。
優點和缺點
優點:全面性、穩定性、連續性、可比性
曾經是我國數據收集的主要方式 缺點:耗費大、數據質量差、基層負擔重10(2)普查概念:對調查對象中所有總體單位都進行調查,目的是為了詳盡地了解重要的國情國力。目前,我國政府開展的普查主要有人口普查、第三產業普查、工業普查、農業普查,這些普查都是每10年進行一次,分別在逢0、3、5、7的年份實施;基本單位普查每5年進行一次,在逢1、6的年份實施。
11普查應該注意:統一規定普查的標準時間和統一的普查期限,以避免由于時間變動使資料重復和遺漏。統一規定普查內容和指標解釋,不得任意改變或增減項目。同類普查,各次調查的項目應盡可能一致,以便于歷史資料的對比研究。同類普查應盡可能按周期進行,以便觀察現象發展變化的過程和規律。12(3)抽樣調查抽樣調查是總體中隨機抽取一部分單位作為樣本進行調查,并根據樣本資料來推斷總體數量特征的一種非全面調查方法。廣義的抽樣包括概率抽樣和非概率抽樣。概率抽樣也稱隨機抽樣,是指按照隨機原則從總體中抽取部分單位構成樣本。非概率抽樣也叫非隨機抽樣,是指從研究目的出發,根據調查者的經驗或判斷,從總體中有意識地抽取若干單位構成樣本。非概率抽樣常用的方式主要有方便抽樣和判斷抽樣。13方便抽樣是指不考慮抽樣的概率,純粹以便于取得樣本的方式進行抽樣。判斷抽樣是指研究人員根據經驗、判斷和對研究對象的了解,有目的地選擇一些單位作為樣本進行調查的抽樣方式。14概率抽樣和非概率抽樣是性質不同的兩種抽樣類型,在調查中采用何種抽樣類型,取決于研究問題的性質、使用數據要說明的問題、調查對象的特征、調查費用、調查時間等多方面的因素。統計上所說的抽樣一般都是指概率抽樣,即指隨機抽樣調查。本教材若無特別說明,抽樣均指概率抽樣,抽樣調查也即對隨機樣本的調查。15常用的概率抽樣方式
(了解)簡單隨機抽樣,也稱為純隨機抽樣,是一種最基本的抽樣形式。這種抽樣方式無須對總體單位進行任何劃分或排隊,只需對總體單位進行編號,利用抽簽法、隨機數表或計算機隨機取數法等完全隨機地直接從總體中抽取樣本單位,每個總體單位入樣的概率是相等的。16分層抽樣(類型抽樣)(了解)概念首先將總體單位按某一標志分層(分類、分組);然后在各層按隨機抽樣的方法分別抽出各層的樣本。特點:分層抽樣在層內是抽樣調查,層間是全面調查;分層抽樣保證了樣本中包含有各種特征的抽樣單位,樣本結構與總體結構比較相近,從而可以提高估計的精度。適用于類別間差異比較大的情況;不僅能夠用樣本推斷總體,還可以用各子樣本推斷相應子總體的特征,深化對總體的認識。17等距抽樣(機械抽樣或系統抽樣)(了解)概念:首先將總體單位按某一標志排隊, 然后計算抽樣間隔距離,后在第一個抽樣距離內確定抽樣起點r, 最后抽取樣本單位(或樣本點)構成樣本(按固定的間隔和排隊順序)。關鍵:1)排隊(選擇排隊標志,可與調查標志有關,也可與調查標志無關); 2)確定抽樣起點(即第一個樣本單位)。18無關標志排隊等中距抽樣(了解)等距抽樣據以排隊的標志與調查內容無關。抽樣起點可隨機確定,,完全遵循了隨機原則,不會產生系統偏差。抽樣效果近似簡單隨機抽樣,注意:抽樣間隔現象的周期長度整數。否則所抽取的樣本有系統偏差。
這種周期有時是比較隱蔽的。如工人交班時間、地塊中農作物垅長、社區住戶調查中門牌號碼(樓層)。19有關標志排隊等距抽樣(了解)特點:將總體單位按某一有關標志排隊的結果。排隊后,就所要調查的標志來看,總體單位也大致呈順序排隊。抽樣起點不宜隨機確定。20半距起點等距抽樣(中心系統等距抽樣)(了解)——在第一個抽樣距離中的一半為抽取起點r。優點:樣本代表性高。局限性:限制了抽樣的隨機性受到限制;而且只能抽取一個樣本。抽樣效果:理論上接近分層抽樣的效果。21對稱等距抽樣(了解)在第一個抽樣距離內隨機地確定抽樣起點;然后以組界為對稱點兩兩對稱地抽取樣本單位(或樣本點)。如下圖所示(符號
表示樣本單位的位置):22整群抽樣(集團抽樣)(了解)概念:首先將總體單位劃分為R個群;然后按隨機的原則不重復地抽出r個群構成樣本,在抽中群中進行全面調查。特點:簡化了抽樣組織工作,便于實施調查和組織管理。。缺點:樣本單位在總體中過于集中,樣本代表性較差,抽樣誤差較大。適用:群間差異不大,而群內差異較大的情況。23(4)重點調查概念重點調查——是指在調查對象中選擇一部分重點單位進行調查,用以反映總體基本情況的非全面調查方法。重點單位是指就所要調查的標志而言,標志值所占比重較大的少數總體單位。24
重點調查的特點(1)調查目的主要用于掌握總體基本情況;(2)調查單位的選取有客觀標準。 適用范圍(1)適用于現象總量在各總體單位之間的分布極不均衡,客觀上存在重點單位的情況;(2)既可以用于一次性調查,也可用于經常性調查。25(5)典型調查(了解)
典型調查的概念典型調查——是在對調查對象有一定了解基礎上,有意識地選擇少數典型單位進行的非全面調查方法。
典型調查的特點 調查目的是為了深入研究某一問題; 調查單位是根據調查目的有意識地選取的。
調查結果不能用于推斷總體
作用 彌補全面調查的不足; 用于研究新生事物; 在一定條件下,用來推算總體數值。(劃類選典)劃類選典分類與典型調查方法的結合可以用于推斷總體26調查單位構成目的與總體的關系重點調查重點單位了解總體基本情況不宜推斷總體典型調查有意識選擇典型單位了解生動具體資料劃類選典可以推斷總體,但不能計算和控制誤差
抽樣調查按隨機原則抽取部分單位推斷總體可計算和控制誤差三種非全面調查的比較(了解)272.統計數據收集的基本方法(1)直接觀察法直接觀察法是調查人員深入現場對調查單位進行直接觀察、記錄和計量。(2)報告法報告法是指被調查者按照調查者的要求,根據自己的實際情況如實填報調查內容,以信函、傳真、計算機網絡等方式向調查者報送數據的方法。(3)訪問法訪問法也稱采訪法、詢問法,是由調查人員提問、被調查者回答來獲取數據的方法。訪問方式也是多樣的,可以集團座談,也可以個別訪問;可以街頭訪問,入戶訪問;也可以面談訪問、電話訪問等。除了以上幾種傳統的調查方法以外,隨著計算機網絡技術的普及,電子郵件調查法、WED站點調查法、計算機電話輔助調查等以互聯網絡為平臺進行調查的方法應運而生,其應用范圍日益廣泛。283.統計誤差概念統計數據與客觀現象真實數值之間的差異按來源不同登記性誤差和代表性誤差登記性誤差是指在調查、匯總過程中由于觀察、測量、登記、計算等方面的差錯或被調查者提供虛假、錯誤資料而造成的誤差。這種誤差在任何一種調查形式中都可能產生.代表性誤差是非全面調查所特有的,是指由于所調查的部分單位與總體在結構上不完全相同,用部分單位的數據推斷總體數量特征所產生的誤差。29抽樣誤差和非抽樣誤差統計誤差還可分為抽樣誤差和非抽樣誤差。抽樣誤差是一種隨機的代表性誤差,是由于抽樣的隨機性引起的樣本估計量與總體參數之間的誤差。對于任何一個隨機樣本,這種誤差都無法避免,但可以計算和控制。非抽樣誤差是相對于抽樣誤差而言的,是指除隨機抽樣以外之外的各種原因引起的統計數據與客觀真實值之間的差異,既包括各種登記性誤差,也包括代表性誤差中的非隨機誤差,無論是概率抽樣還是非概率抽樣,或是全面調查,都有可能產生非抽樣誤差。30二、統計調查方案(一)確定調查目的為什么調查,解決什么問題(二)確定調查對象、調查單位和填報單位
調查對象是所要調查事物的全體,由許多個別單位構成,即統計總體。調查單位是所要調查的具體單位,是調查項目的具體承擔者,即總體單位。前者確定調查范圍,后者明確具體向誰調查。
調查單位要與調查的填報單位或報告單位相區別。(三)確定調查項目調查項目是具體的調查內容,是調查單位具有的特征,由一系列品質標志和數量標志構成。31(四)調查表與問卷設計為了便于調查和匯總,應該把調查項目按一定順序排列在表格中,這就是調查表。一個調查單位填寫一份的調查表稱為單一表,若干個調查單位填寫一份的調查表稱為一攬表。(五)確定調查組織形式和方法明確調查的組織形式和收集數據的具體方法。(六)確定調查時間確定調查時間一是指確定調查的標準時間,即調查資料所屬的時間,二是指調查期限,即整個調查工作從開始到結束的時間,包括調查登記的時間、數據處理的時間、數據分析的時間。(七)確定其它事項包括確定調查機構、培訓計劃、是否需要試點、經費預算、資料報送程序和方法、數據公布時間等。32三、次級資料的收集次級資料的收集通常稱為文案調查,是指利用單位內部和外部的各種信息和情報資料,對所需數據資料進行調查;也稱為間接調查、桌面調查和二手資料調查。這種調查不受時空限制,可以獲得實地調查難以取得的大量歷史資料。次級資料包括內部資料和外部資料。內部資料主要指企業或單位內部相關的數據或檔案。外部資料指通過統計部門、信息咨詢機構、電臺和電視臺、圖書和報刊雜志、互聯網絡等渠道公布的有關資料。33§2.2統計數據的整理統計整理是指根據統計研究的需要,將統計調查階段所搜集到的大量個體資料進行科學的分類匯總、加工處理,或對已經經過加工的次級資料再加工,使之系統化、條理化,以符合統計分析的需要,成為能夠反映事物總體特征的綜合資料的過程。內容數據處理:分類、匯總、表現(制表)數據管理:輸入、貯存、更新、輸出步驟審核原始資料、數據的分類匯總數據的表現、數據保管和發布
原始數據的整理一般是分類和匯總性的整理,次級資料的整理主要是分組。34一、統計分組1、概念統計分組就是根據統計研究的需要,將總體中的所有單位按照一定的標志分為若干部分或組別的方法。
對總體——分;
對個體——合。突出組與組之間的差異、抽象組內各單位差異2、作用
劃分總體類型、反映現象內部結構和比例關系、揭示現象間的相互依存關系3、原則
科學性、完備性、互斥性
354、統計分組的種類
按標志的性質分為品質標志分組和數量標志分組。品質標志分組是從屬性上區分各種類型組,其關鍵是界定各類型的性質差異。數量標志分組是從某個變量的數量差異上區分各種類型組,其關鍵是證券劃分各組界限。
按分組標志多少分為簡單分組和復合分組。簡單分組按一個標志對總體單位進行分組,它只反映總體某一方面的類型和結構特征。復合分組按兩個或以上標志對總體單位進行重疊分組,復合分組還可以顯示結構的層次,說明總體內部類型的主從關系。
36二、分布數列---統計分組整理的基本結果1.分布數列的概念將總體各單位按某個標志分成若干組,列出各組的總體單位數或各組單位數在總體單位數中所占的比重,這樣形成的數列稱為分布數列。它表明總體單位在各組的分布狀況。
次數(頻數)是分布在各組的單位數。頻率是各組單位數在總體單位數中所占的比重。372.分布數列的種類
(1)品質數列是按品質標志分組形成的分布數列
38表2-1某公司職工文化程度狀況文化程度工人數比重(%)小學4008初中150030高中260052大學50010合計5000100品質標志39性別是品質標志性別人數(萬人(比重(%)男6362950.98女6118149.02合計124810100.00表2-2某年中國人口狀況402、變量數列
是按數量標志分組而形成的分布數列,定量數據。41變量數列單項式變量數列組距式變量數列42(1)單項式變量數列以一個變量值作為一組的變量序列是單項式變量數列。適合于離散變量
——取值可以一一列舉適合于變量值較少,變動幅度不大的情況43表2—7某企業日產量
日產量工人數107011100123801315014100合計80044將變量值的一個區間作為一組的變量數列是組距式變量數列每一組兩端的值稱為組限,各組最小值稱為下限,最大值稱為上限。適合于連續變量,也適合于變量值較多、變化幅度大的情況(離散變量)相鄰兩組間的上下組限可以重疊也可以不重疊。一般來說,離散變量采用不重疊組形式,連續變量采用重疊組形式。區間的長度稱為組距開口組、開口數列等距數列、異距數列(2)組距式變量數列45表2—8某班學生考試成績次數表成績(分)學生人數向上累計向下累計60以下225460-7015175270-8019363780-9015511890-1003543合計54————組限重疊46等距數列表2-10某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計50100組限重疊47表2-11某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計50100組限間斷48開口數列表2-12某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)109~以下110~114115~119120~124125~129130~134135~以上358141064610162820128合計50100適合數據集有極端值的情況49組距的計算組限重疊組距=本組上限-本組下限組限間斷組距=本組上限-上組上限=下組下限-本組下限據此可以判斷等距與不等距數列50開口數列?組中值:各組上下限的中點值。當組內變量值均勻分布或對稱分別時,組中值可作為組變量值的代表值。組中值的計算51確定分組形式3.編制變量數列的步驟確定組數確定組距確定組限排序計算頻數表現現象的度、規定的界限體現分布的集中趨勢考慮到習慣、便于對比52某月啤酒公司60個銷售點的銷量487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750單位:桶
excel53啤酒銷售量的分布數列(表2-3)銷售桶數銷售點數頻率(%)19以下11.720—2935.030—3958.340—491626.750—592033.360—69915.070—7946.780以上23.3合計60100.0544.累計次數分布551.向上累計
次數的累計從變量值較小的組相變量值較大的組累計,反映小于該組上限的次數或百分數總共有多少。2.向下累計
次數從變量值較大的組向變量值較小的組累計,反映大于該組下限的次數或百分比總共有多少。56某班學生考試成績次數表成績(分)學生人數向上累計向下累計60以下225460-7015175270-8019363780-9015511890-1003543合計54————57定序數據頻數分布表【例2.2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。
表2-5甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)向上累積向下累積戶數(戶)百分比(%)戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0————58定序數據的圖示—累計頻數分布圖243001322252700100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(戶)(a)向上累積27616830300750100200300400
非常不滿意
不滿意
一般
滿意
非常滿意累積戶數(戶)(b)向下累積圖2-3甲城市家庭對住房狀況評價的累積頻數分布595.次數分布類型和次數分布圖(1)次數分布類型鐘型分布——中間多、兩頭少對稱分布——如正態分布左偏分布(負偏)右偏分布(正偏)U型分布兩頭大,中減少J型分布一頭大,一頭小60頻數分布的類型U型分布正J型分布反J型分布對稱分布右偏分布左偏分布612.3統計表和統計圖2.3.1統計表1.統計表的概念表現經過整理的統計數據按一定結構和順序排列而成的表格統計數據最規范的表現形式
2.統計表的構成標題——總標題、橫行標題、縱列標題橫行、縱列數字資料表外附加6263表2-122007年我國城鄉居民家庭人均收入及恩格爾系數家庭人均可支配收入恩格爾系數(%)絕對額(元)指數(1978=100)農村居民4140.4734.443.1城鎮居民13785.8752.336.3總標題縱列標題數據橫行標題資料來源:《中國統計年鑒2008》注釋:表外附加(表腳)63表2—131999年世界500強企業中利潤額最高的前五個行業總標題橫
行
標
題數
字
資
料縱列標題資料來源:《中國國情國力》2000年第10期表外附加主詞賓詞6465家庭人均可支配收入恩格爾系數(%)絕對額(元)指數(78=100)農村居民2366.4503.847.7城鎮居民6859.6416.338.2家庭人均可支配收入恩格爾系數(%)絕對額(元)指數(78=100)農村居民3254.9624.545.5城鎮居民10493.0607.436.72005年2001年家庭人均可支配收入恩格爾系數(%)絕對額(元)指數(78=100)農村居民3587.0670.743.0城鎮居民11759.5670.735.82006年65分組年份家庭人均可支配收入恩格爾系數(%)絕對額(元)指數(78=100)農村居民20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.1城鎮居民20012005200620076859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.3我國農村和城鎮居民家庭人均可支配收入及恩格爾系數聯合國糧農組織針對該系數提出具體標準:即恩格爾系數在59%以上為貧困,在50-59%之間為溫飽,在40-50%之間為小康,在30-40%之間為富裕,低于30%為最富裕。
66年份農村居民城鎮居民人均可支配收入(元)指數(78=100)恩格爾系數(%)人均可支配收入(元)指數(78=100)恩格爾系數(%)20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.16859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.567統計表按主詞是否分組及分組標志的多少:簡單表:對總體未進行任何分組;簡單分組表:對總體僅按一個標志進行分組;復合表;對總體按兩個及以上的標志進行重疊分組。1994——1997年城鄉居民家庭人均收入單位:元簡單表68
表2—2某城市居民關注廣告類型的頻數分布1001200合計56.025.54.58.05.01.00.5600.2550.0450.0800.0500.01011251916102
商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告頻率(%)比例人數(人)廣告類型簡單分組表:69某地區工業企業產值統計表復合表:70列聯表又稱為交叉表,是由兩個以上的變量進行交叉分類的頻數分布表對于定類數據的描述和分析,通常采用列聯表進行交叉分析。列聯表是由兩個以上的變量進行交叉分類的頻數分布表。列聯表就是復合分組表。列聯表,P35性別月平均通信費(元)50以下50~60。。。合計男女合計表x某校300為學生性別與通信費列聯表71總標題內容應滿足3W要求(whatwherewhen)要合理安排統計表的結構數據計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明表中的上下兩條橫線一般用粗線,其他線用細線通常情況下,統計表的左右兩邊不封口表中的數據一般是右對齊,有小數點時應以小數點對齊,而且小數點的位數應統一對于沒有數字的表格單元,一般用“——”表示必要時可在表的下方加上注釋4.統計表的設計規則7273制作頻數分布表用圖形顯示數據列出各類別計算各類別的頻數2.3.2統計圖次數分布圖73定性數據整理—頻數分布表【例】為研究廣告市場的狀況,一家廣告公司在某城市隨機抽取200人就廣告問題做了郵寄問卷調查,其中的一個問題是“您比較關心下列哪一類廣告?”1.商品廣告;2.服務廣告;3.金融廣告;4.房地產廣告;5.招生招聘廣告;6.其他廣告。廣告類型人數(人)比重(%)商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告1121651910256.025.54.58.05.01.0表2-9某城市居民關注廣告類型的頻數分布74定性數據的圖示—柱形圖柱形圖是用寬度相同的條形的高度或長短來表示數據變動的圖形柱形圖有單式、復式等形式在表示定性數據的分布時,是用柱形圖的高度來表示各類別數據的頻數或頻率繪制時,各類別可以放在縱軸,又稱為條形圖,也可以放在橫軸,稱為柱形圖75定類數據的圖示—條形圖人數(人)5191610211204080120
商品廣告
服務廣告
金融廣告
房地產廣告
招生招聘廣告
其他廣告廣告類型
圖2-7某城市居民關注不同類型廣告的人數分布76定量數據——直方圖用矩形的寬度和高度來表示頻數分布的圖形,在平面直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖。直方圖要求各組具有相同的組距,這樣每一組的矩形面積就與該組的次數完全對應。異距數列作直方圖時,應將不等組距調整為等距組。直方圖下任何一個矩形所占面積的百分數與其頻率值相同。77表2-10某車間50名工人日加工零件數分組表按零件數分組頻數(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計5010078分組數據—直方圖頻數(人)1512963105110115120125130135140日加工零件數(個)圖2-2某車間工人日加工零件數的直方圖79表2-14某車間50名工人日加工零件數的異距分組表按零件數分組頻數(人)頻率(%)105—110110—115115—120120—125125—135135—1403581416(=10+6)4610162832(=20+12)8合計5010080頻數(人)1512963105110115120125135140日加工零件數(個)次數怎么增加了?直方圖的面積之和不等于總次數圖2-4根據表2—14某車間工人日加工零件數的異距分組表所作直方圖10681找出標準組距:該例為5頻數密度=頻數/組距=16/10=1.6
標準組距的頻數=5×1.6=8按標準組距的次數8作直方圖。異距數列作直方圖時,應將不等組距調整為等組距。調整的方法是:以標準組距乘以頻數密度(頻數密度=頻數/組距)得到標準組距的頻數,再按標準組距的次數作直方圖。82105110115120125140直方圖的面積之和等于總次數圖2-5根據表2—14某車間工人日加工零件數異距分組表按標準組距所作直方圖13513088頻數(人)1512963日加工零件數(個)83直方圖與條形圖的區別條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的;直方圖是可用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義;直方圖的各矩形通常是連續排列,條形圖則是分開排列。84折線圖折線圖也稱頻數多邊形圖(Frequencypolygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的851512963105110115120125130135140日加工零件數(個)頻數(人)折線圖下的面積與直方圖的面積相等!圖2-3某車間工人日加工零件數的折線圖86曲線圖曲線圖是用一條光滑的曲線表示次數分布;當直方圖的組距無限縮小時,折線圖就成了曲線圖曲線圖是折線圖的理論圖8788莖葉圖莖葉圖是反映原始數據的圖形。它由莖和葉兩部分構成。通過莖葉圖,可以看出數據的分步形狀及數據的離散狀況,如分布是否對稱,數據是否集中,是否有離群點等等。繪制莖葉圖關鍵是設置好樹莖。制作莖葉圖時,首先把一個數字分成兩部分,通常是以該數據的高位數值作為樹莖,而且葉上只保留該數值的最后一個數字。如125分成125,12分成12,前部分是樹莖,后部分是樹葉。莖葉圖類似于橫置的直方圖,與直方圖相比,莖葉圖既能夠給出數據的分布狀況,又能夠給出每一個原始數據。而直方圖雖然能夠很好的顯示數據的分布,但不能保留原始數值。在應用方面,直方圖通常適用于數據量大的情況,莖葉圖通常適用于小批量數據。89141156215205196191187181177173143158218206197192187182177173144159223207197194188182178174149160225208198194188183178174150160226209198195188184178174152161228210200195189185179175153161233210201196189186179175153162233211202196189186179175154163234211203196190187180176155163234213203196190187180176165164237214171172172172167168166168165168171172173165170172某電腦公司某年4個月銷售量90某電腦公司某年4個月銷售量91圓形圖也稱餅圖,是用圓形及園內扇形的面積來表示數值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用在繪制圓形圖時,總體中各部分所占的百分比用園內的各個扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的例如,關注服務廣告的人數占總人數的百分比為25.5%,那么其扇形的中心角度就應為3600×25.5%=91.80,其余類推92
其他廣告1.0%
房地產廣告8.0%
商品廣告56.0%
金融廣告4.5%
服務廣告25.5%
招生招聘廣告5.8%圖2-8某城市居民關注不同類型廣告的人數構成93【例】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。
表2-10甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)向上累積向下累積戶數(戶)百分比(%)戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計300100.0———
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CHES 101-2023水質8種烷基酚類化合物和雙酚A的測定氣相色譜-質譜法
- T/CFPA 022-2023脹噴式干粉滅火裝置
- T/CECS 10210-2022給水用膠圈電熔雙密封聚乙烯復合管材及管件
- T/CECIA 06-2022企業社會責任管理體系人員能力要求
- T/CCS 012-2023綜放液壓支架智能放煤控制系統技術條件
- T/CCPITCSC 100-2022城市文化生活綜合體全過程代建規范
- T/CCOA 26-2020特級亞麻籽油
- T/CCASC 2003-2023環氧氯丙烷副產氯化鈣應用技術要求
- T/CBMCA 021-2021螺栓連接裝配式混凝土墻板結構房屋技術標準
- T/CAQI 89-2019家用和類似用途一般水質處理器精準凈化要求及測試方法
- 工改工政策分析課件
- 2023年徐州市泉山區工會系統招聘考試筆試題庫及答案解析
- 醇基燃料技術資料
- 施工企業資質及承接工程的范圍
- 泥漿測試記錄表
- 《摩擦力》說課課件(全國獲獎實驗說課案例)
- 個人信用報告異議申請表
- 初中數學 北師大版 七年級下冊 變量之間的關系 用圖象表示的變量間關系 課件
- 2023年藝術與審美期末試卷答案參考
- 電氣工程竣工驗收表格模板
- 制程品質檢驗流程圖
評論
0/150
提交評論