第二章-統計調查與統計整理_第1頁
第二章-統計調查與統計整理_第2頁
第二章-統計調查與統計整理_第3頁
第二章-統計調查與統計整理_第4頁
第二章-統計調查與統計整理_第5頁
已閱讀5頁,還剩114頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1教學目標與重難點統計調查、整理和顯示第二章1.了解數據的計量尺度與數據的類型2.了解統計調查方式、收集方法3.掌握統計調查的常見的組織形式4.掌握調查方案的設計5.會用excel生產數據頻數分布表。2第一節

數據的計量與類型3一、數據的計量尺度**(一)定類尺度(nominalscale)

1.概念:又稱列名尺度或類別尺度,是按照事物的某種屬性對其進行平行的分類或分組。

2.舉例:人的性別、籍貫、民族;企業的所有制性質、行業隸屬。

3.特征

(1)只能區分事物的類別,無法比較優劣或大小。(2)對事物的區分必須遵循窮盡和互斥的原則。(3)對定類尺度計量分析的統計量主要是頻數和頻率。

4(二)定序尺度(ordinalscale)1.概念:又稱順序尺度,它是對事物之間等級或順序差別的一種測度。2.舉例:教師的職稱(助教、講師、副教授、教授)、學歷(本科、研究生、博士),商品的質量等級(一等品、二等品、三等品)。

3.特征

(1)對事物可以分類、比較優劣和大小。(2)對事物的分類要求窮盡和互斥。(3)對定序尺度計量分析的統計量除頻數和頻率外,還有累計頻數和累計頻率。

5(三)定距尺度(intervalscale)

1.概念:又稱間隔尺度,是對事物類別或次序之間的間隔進行的一種測度。2.舉例:學生的考試成績、人的身高、溫度等。

3.特征

(1)能分類、排序、比較大小,計量差距。(2)沒有絕對零點,即定距尺度的計量值可以為0,這里的0表示一個數值。“0”表示“0”水平,而不表示“沒有”或“不存在”。例1:一個學生的統計學成績為0,表示統計學成績水平為0,并不是說沒有考試成績或沒有統計學知識。例2:一個地區的溫度為0攝氏度,表示一地溫度的水平。由此可見,定距尺度中的0是一個有意義的值。6(四)定比尺度(ratioscale)

1.概念:也稱比率尺度,它與定距尺度屬于同一層次,其計量的結果也表示為數值。除了具備前三種計量尺度的特性外,還有一個特性,那就是兩個測度值之間的比值。2.舉例:人的收入支出、企業的產值利潤、某地區的人口總數、失業人數等。3.特征(1)分類、排序、比較大小、求出差異、計算兩個數值之間的比率。(2)具有絕對零點,即數字“0”表示“沒有”或“不存在”。

**應用:舉一現實生活中的例子說明定比尺度的兩個特征。例1:一個人的月工資收入為600,另一個人的為300,那么我們可以得出第一個人的工資是第二個人的兩倍。例2:一個人的身高為0,那么表示這個人不存在。

7表2-1四種計量尺度的比較8二、數據的類型(一)數據的類型和表現形式1.定性數據(品質數據)(1)概念:說明事物的品質特征,不能以數值表示,只能以文字表述,由定類和定序尺度計量形成。

(2)舉例:高校教師職稱有助教、講師、教授等。2.定量數據

(數量數據)(1)概念:說明現象的數量特征,以數值表示。由定距和定比尺度計量形成。

(2)舉例:考試成績80分、95分、100分,身高1.73米、1.80米等。**應用:舉例說明還有哪些常見的定性數據和定量數據。9(二)變量及其類型1.變量的含義

說明現象某種屬性或數量特征的概念稱為變量。統計數據就是變量的具體表現。2.變量的類型(1)品質變量:反映事物品質特征的名稱,表現為定性數據。如教師職稱。(2)數值變量:反映事物數量特征的名稱,表現為定量數據。如人的身高。3.數值變量的分類(1)離散變量:只能取有限個值,間斷計數的變量。如人口數、設備臺數等。(2)連續變量:可以取無窮多個值,連續計數的變量。如產值、利潤、收入、年齡等。思考:一個燈泡的壽命X是什么變量?10三、統計數據的表現形式(一)兩種基本表現形式

1.絕對數時期數(反映現象在一段時期內的總量)

時點數(反映現象在某一瞬間上的總量)2.相對數:兩個絕對數的比值,反映事物的相對數量。(二)絕對數的計量單位1.實物單位:根據事物的具體屬性和特點,如車以輛為單位。2.價值單位:以貨幣形式對現象進行度量。3.復合單位:由兩種計量單位復合而成的。(三)比例:一個總體中各個部分的數量占總體數量的比重。

比率:各不同類別的數量的比值。11第二節統計數據的收集12當一項統計工作開始時,我們就要明確需要準備哪些資料,進而要考慮如何收集資料以及到哪里去收集資料,是采用間接的現成材料還是要直接親自收集。對于直接引用現成資料,我們要熟知有哪些統計資料可以直接用,比如各級政府的公報、年鑒、各種專業數據庫等。另外,需要掌握現代的檢索方法,以便更快更有效的收集到所需要的信息。若是所要收集的資料需要我們自己去搜集的話,要明確要采取什么樣的研究方式。一般有兩種方法取得資料:實驗式(P17)和非實驗式(P17)(觀察法)。

統計數據的直接來源渠道有二:一是專門組織調查,二是科學實驗。專門組織調查是取得社會經濟數據的重要渠道,而科學實驗是取得自然科學數據的主要渠道。下面我們重點討論取得社會經濟數據的方式和方法。13一、按調查對象包括的范圍分類

全面調查非全面調查調查范圍普查全面統計報表典型調查重點調查抽樣調查一、統計調查的組織形式14(一)普查指為某一特定目的而專門組織的一次性全面調查。作用特點重大國情國力的基本統計信息可以為抽樣調查提供抽樣框可以搜集統計報表所不能提供的反映通常是一次性的或周期性的。由于需要大量的人力、物力和財力,不宜經常進行一般需要規定統一的標準調查時間,以避免重復和遺漏。人口普查7月1日零時數據一般比較準確,規范化程度較高適用對象較狹窄,一般是最基本、最一般現象的時點狀況普查15指樣本單位的抽取不受主觀因素及其他系統性因素的影響,每個總體單位都有均等的被抽中機會按照隨機原則從調查對象中抽取一部分樣本單位進行調查,再用樣本資料推斷總體的數量特征的一種非全面調查組織方式抽樣調查機理優點按隨機原則抽取樣本單位目的是推斷總體的數量特征抽樣誤差可以事先計算并控制能用較少的人力、物力和時間達到全面調查的目的(經濟性、時效性)廣泛性適用于對各個領域、各種問題的調查調查資料的準確性較高、受人為干擾的可能性較小隨機原則(二)抽樣調查16(三)統計報表

優點局限能保證統計資料的全面性和連續性能保證統計資料的統一性和及時性能滿足各級部門對統計資料的需要統計報表過多會增加基層負擔有可能由于虛報瞞報而影響統計資料質量指按照國家有關法規的規定,自上而下的統一布置、自下而上地逐級提供基本統計數據的一種調查方式(統一表式、內容、時間和程序)類型統計報表按實施范圍不同:國家、部門、地方報表按調查范圍不同:全面、非全面報表按報送周期長短:日、旬、月、季、半年、年報按填報單位不同:基層、綜合按報送方式不同:電訊報表、書面報表17只適用于客觀存在著重點單位的情況重點調查這些單位數目不多,但其標志值在總體標志總量中占有較大比重,能反映總體的基本情況作用局限能以較少的投入和較快的速度取得總體基本情況及變動趨勢的資料為了解總體基本情況,在調查對象中只選擇一部分重點單位進行調查的一種非全面調查組織方式。重點單位(四)重點調查重點調查的關鍵是要選擇好重點單位。重點單位的選擇著眼于標志量的比重,因而重點單位的選擇具有客觀性18典型調查在對調查對象有一定了解的基礎上,有意識地選擇若干具有代表性的典型單位進行調查的一種非全面調查組織方式一定條件下能估計總體指標數值可以補充全面調查的不足可以用來研究新生事物不能確定推斷的把握程度,無法計算和控制推斷誤差作用局限(五)典型調查19抽樣調查、重點調查與典型調查的區別一是:調查單位取得方式不同。重點調查是選擇為數不多但標志量占總體標志量絕大比重的單位進行調查;抽樣調查中的樣本單位是按照隨機原則從研究總體中抽取的,具有較高的代表性;典型調查時對總體情況分析的基礎上有意識的抽選出的調查單位。二是:研究的目的不同。重點調查時為了了解現象總體的一般情況,但不能推斷總體總量;而抽樣調查的目的在于在于以樣本量來推斷總體總量,研究總體的數量特征;典型調查說明總體的發展變化規律。三是:推斷的可靠程度不同。抽樣調查的結果最具有科學性,其他兩種具有一定代表性。四是:適用場合不同。

重點調查適用于部分單位可以比較集中地反映所研究的項目;抽樣調查最適宜于那些不能或者很難進行全面調查而又需要全面數值的場合,比如研究檢查產品質量合格狀況。典型調查適用于對總體現象進行分析,通過典型反映規律。抽樣調查、典型調查與重點調查之間的根本區別在于選取調查單位的方法不同。20二、統計數據的來源212223三、數據的收集方法P20-21(一)訪問調查:通過面對面的交談獲取資料。(二)郵寄調查:通過郵寄或其他方式將調查問卷送至被調查者,由被調查組填寫,然后寄回或投放到指定收集點的方法。(三)電話調查:調查人員利用電話通受訪者進行交流獲取資料的方式。(四)座談會:也稱集體訪談法。(五)個別深度訪問:一次只有一名受訪者參加的特殊的定性研究。24四、統計調查方案的設計(一)確定調查的目的和任務(為什么調查)這是設計方案的首要問題。(二)確定調查對象和調查單位(向誰調查)1.調查對象:需要進行調查的某一社會經濟現象的總體。對應于統計總體。2.調查單位:調查對象中需要調查的具體單位。對應于總體單位。它是調查資料的直接承擔者。3.報告單位:指調查資料的提交者。(三)確定調查項目(調查什么)

25統計調查方案用來指導整個調查工作的綱領性文件,是統計設計在統計調查階段的具體化.

一、確定調查目的二、確定調查對象和調查單位三、確定調查項目和調查表四、確定調查時間和調查期限五、制定調查的組織實施計劃26一、確定調查目的——明確調查所要研究和解決的問題

要求目的明確,任務具體,以免造成理解不同而使搜集來的資料口徑不一。例如:①了解銀行的基本情況了解各項方針政策在銀行的執行情況了解銀行機構設置和人員配備情況②對農民經濟情況進行調查從農業生產方面來研究從農民消費方面來研究2728二、確定調查對象和調查單位——明確調查的范圍以及向誰調查,由誰來提供具體資料。調查對象需要研究的社會經濟現象的全體,它是由性質相同的許多個別單位所組成的。調查單位構成調查對象的個體,是所要調查的具體單位,因此是調查標志的直接承擔者。例如:要了解銀行的經營狀況,則所有的銀行是調查對象,每一銀行是調查單位。29例如:農業人口統計一、常住人口中直接參加農林牧漁業生產活動的勞動力及贍養人口二、兼營農業和非農業勞動者,全年從事農業生產活動時間累計達到或超過四個月的三、如果不足四個月,但農業純收入占總純收入比重超過50%的

30調查單位填報單位與一致不一致進行科研機構普查,每個科研機構既是調查單位,又是填報單位。進行科研機構人員普查,調查單位是每一位科研人員,填報單位則是每所科研機構例如有時一致有時不一致填報單位指負責提供調查資料內容的單位當調查單位自己負責向上報告時,它同時也是填報單位;當調查單位的資料由它的上級組織收集整理并向上報告時,填報單位與報告單位則不一致。31三、確定調查項目和調查表(調查問卷的設計)調查項目——調查中所要了解的具體內容,是所要反映的調查單位的特征(標志)

調查表——把已確定的調查項目按照一定的結構和順序排列成的表格。

單一表:適用于調查項目多,調查單位少時。一覽表:適用于調查項目不多時,調查單位多時。注意:1、需要且可能(少而精)2、涵義明確、具體3、項目之間盡可能有聯系32適用于調查項目多,調查單位少時將一個調查單位的項目登記在一份表或一種卡片上。這便于容納較多的項目,且便于整理、分類,缺點是繁瑣。單一表33身體發育狀況調查表

適用于調查項目不多時,調查單位多時把許多調查單位和相應的項目按次序登記在一張表格里。這便于匯總,但缺點是分不開,故調查深度不夠;編號:一覽表341、問卷設計的步驟1).根據研究目的建立分析架構2).決定問卷之形式3).編擬問卷初稿4).邀請專家學者檢查、修訂問卷5).預試問卷6).問卷定稿并訂定使用說明352、問卷的基本結構

問卷的基本結構開頭部分甄別部分主體部分背景部分問候語,

填寫說明,

問卷編號

也稱過濾,通過一些問題篩掉不符合條件的被調查者。要調查的全部問題,以及這些問題可供選擇的答案。被調查者的性別,職業,收入,文化程度,婚姻狀況等363.問卷中問題的設計

(1)提問的內容盡可能短。

問題中應該堅決摒棄多余的修飾詞,提問

的內容盡可能的短,若問題比較復雜,應將

其分為幾個問題來問?!拔覈絹碓蕉嗟娜巳饴糜巍D浫e的國家旅游過嗎?如果去過,您也許是為了欣賞風光才去的。那么,別國的風光對您決定出國旅游有多重要?”Q1:您出國旅游過嗎?1、是2、否(終止訪問)Q2:那里的風光對您決定去旅游有多重要?37(2)用詞要確切通俗,避免不具體的問題問卷中的用詞要確切、通俗,應容易被人理

解,應避免使用過于專業的術語(例如嚴重急性呼吸系統綜合癥);設計的問題要適合所有被調查者;提問目的要明確,避免模棱兩可。

Q:您對本餐廳是否滿意?□1.滿意□2.一般□3.不滿意

滿意一般不滿意Q1:您對本餐廳飯菜質量是否滿意?□□□Q2:您對本餐廳環境設施是否滿意?□□□Q3:您對本餐廳服務態度是否滿意?

□□□38(3)一項提問只包含一項內容一個問句最好只問一個要點。一個問句中如果包含過多詢問內容,會使被調查者無從答起,給統計處理也帶來困難。你經常看電影和電視嗎?39(4)避免誘導性提問

應避免誘導性、暗示性的提問。誘導性

提問會導致兩個不良后果:被調查者不加考慮就同意所誘導問題中暗示的結論;由于誘導性提問大多是引用權威或大多數人的態度,被調查者就會產生心理上的順向反應。

“絕大多數飲用過光明奶的人都認為它口味純正,

您認為是這樣嗎?”

40(5)避免否定形式的提問否定式的提問會影響到被調查者的思維,

或容易造成相反意愿的回答。

Q:您不認為聽到國歌不立正不是不對的嗎?□1.是□2.不是41(6)避免敏感性問題敏感性問題是指與個人或單位的隱私或私人利益有關而不便向外界透露的問題。問卷中要盡量避免提問敏感性問題或容易引起人們反感的問題,對敏感性問題的調查應當在提問的方式上進行推敲,盡量采用間接詢問的方式,用語也要特別婉轉,以降低問題的敏感程度。

你是否在考試中作過弊?您是否有酒后駕車行為?

424.問卷中答案的設計

開放性問題是指對問題的回答未提供任何具體的答案,由被調查者根據自己的想法自由做出回答,屬于自由回答型。

封閉型問題是指對問題事先設計出了各種可能的答案,由被調查者從中選擇。

封閉型問題答案的設計方法主要有:兩項選擇法、多項選擇法、順序選擇法、評定尺度法等。

43(1)、二項選擇法二項選擇法也稱二分法,即提出的問題只有兩種答案:“是”或“否”,“有”或“無”等。這兩種答案是對立的、排斥的,被調查者的回答非此即彼,不能有更多的選擇。如:

您是否購買了筆記本電腦?A、是B、否(一)問卷中答案的設計方法44(2)、多項選擇法

有些問題還需要采用選擇多個答案,以統計出多個答案的重要性及差別。

Q1您購買山地自行車的原因是()(可多選)A、經濟條件許可

B、用于代步工具

C、便于郊外旅游,鍛煉身體

D、別人有你也想有,趕時髦

E、作為禮物送給親人朋友

F、其它

45(3)、順序選擇法順序選擇法的問題是列出若干個答案,

要求被調查者按其重要性或記憶的先后順序將它們一一排列。

Q:您在找工作的過程中遇到的主要問題是(請您依次排序)()A專業不對口B沒有本地戶口C缺乏社會關系D招聘信息不足E性別歧視F其他

46(4)、評定尺度法評定尺度法也稱量表法,量表是一種工具,

是將一些主觀的、抽象的概念定量化。

Q:您對我校教學評估體系總體感覺如何?A、非常滿意B、比較滿意C、一般D、不太滿意

E、非常不滿意

47(二)、設計問題答案時的注意事項答案要窮盡。答案要互斥。您上月的支出中花費最多的是:A食品B服裝C書籍D飲料E其它485.設計問題順序應注意的問題(1)問題的安排應具有邏輯性;(2)問題的安排應先易后難、由淺入深;(3)問卷主體部分的問題通常按過濾性、熱身性、容易性、困難性的順序進行排列。49四、確定調查時間和調查期限

調查時間是指調查資料所屬的時間

時期現象,是現象變動過程的起迄時間。

時點現象,要明確規定統一的標準時點。

調查期限是指進行調查工作的時限,包括搜集和報送資料需要的時間。

我國人口普查規定7月1日零時為標準時點,要求普查登記工作在7月10日完成。調查時間調查期限例如:

7月1日零時十天50思考我國第五次人口普查規定,2000年11月1日零時為普查登記的標準時點,要求2000年11月10日以前完成普查登記。請問:1.調查時間是多少?

2.調查期限是多少?51五、確定調查的組織實施計劃——調查工作順利開展的保證主要內容:調查的組織領導機構和調查人員的組成;調查前的準備工作,如宣傳教育、干部培訓等;明確調查的方式和方法;制定調查工作程序和進度安排調查經費的預算開支;提供或者公布調查成果的時間以及其他事項。52

游客對寬窄巷子歷史街區景觀偏好調查問卷您好!首先非常感謝您抽出寶貴時間來做答問卷。我是四川大學旅游管理專業的研究生,現正在做游客對寬窄巷子景觀偏好的碩士論文,需要耽誤您幾分鐘寶貴的時間回答以下問題并根據照片結合個人感受給予評價。本問卷不用署名,只作為研究所用。再次非常感謝您的配合!第一部分寬窄巷子景觀偏好調查6.請對以下1-32張圖片展示的寬窄巷子街區景觀的喜好進行評分,分值1-5之間,其中1分代表不喜歡,2分代表不太喜好,3分代表中立,4分代表比較喜好,5分代表喜好),并回答問題。例如圖1:(1)請根據您對該街區景觀的喜好程度進行打分()A、1分B.2分C3分D.4分E.5分(2)請選出該景觀使您產生好感的方面()(可多選)A.顏色美B.形態美C.結構布局合理D.歷史文化內涵E.現代感F.懷舊感G創意感H.有意境I.無好感J.參與性強(3)請指出該景觀使您獲得哪方面的滿足感()(可多選)A.視覺享受B.增長知識和信息C.情感上的滿足D.獲得新的感悟E.無滿足感第二部分人口學統計特征1、您的性別:()A、男B、女2、您的年齡段:()A、18歲以下B、19-30C、31-50D、51-60F、60以上3、您的教育程度:()A、初中及以下B、高中及中專C本科或大專D.碩士或博士4、您的家鄉在:()A、北方B、南方5、您是否去過寬窄巷子()A.是B.否

再次非常感謝您的幫助!5354復習小結一、統計數據的計量尺度

(一)定類尺度

(二)定序尺度

(三)定距尺度

(四)定比尺度二、統計數據的類型

(一)定性數據:由定類和定序尺度計量而成,反映事物的品質特征。

(二)定量數據:由定距和定比尺度計量而成,反映事物的數量特征。55復習小結三、統計數據的來源

(一)直接來源:統計調查和科學試驗。

(二)間接來源:引用他人調查或試驗的數據。四、統計調查(數據最主要的直接來源)

(一)統計調查的種類和方法(二)統計調查方案的設計(三)統計調查的組織方式:有普查、統計報表、抽樣調查等,其中重點調查是最常用的最科學的調查方法。五、統計數據的間接來源

包括公開的統計出版物和其他渠道。一、判斷對錯1、全面調查和非全面調查是根據調查結果所得到的資料是否全面來劃分的。()2、對某市下崗職工生活狀況進行調查,要求在一個月內報送調查結果。所規定的一個月時間是調查時間。()3、我國人口普查的總體單位和調查單位都是每一個人,而填報單位是戶。()4、典型調查既可以搜集數字資料,又可以搜集不能用數字反映的實際情況。()5、重點調查與抽樣調查的目的是一致的,即都是通過對部分單位的調查,來達到對總體數量特征的認識。()思考與練習1、在統計調查中,調查內容的承擔者是()

A.調查對象B.調查單位

C.填報單位D.統計報表2、對我國各鐵路交通樞紐的貨運量調查以了解鐵路貨運的總體狀況,這屬于(

A.普查B.重點調查

C.抽樣調查D.典型調查思考與練習二、單項選擇題3、在國營工業企業設備普查中,調查單位是()

A.國營工業企業的每臺設備

B.每個國營工業企業

C.國營工業企業的全部設備

D.所有國營工業企業4、抽樣調查是一種()A.非全面調查B.周期性調查

C.全面調查D.經常性調查

E.大量觀察法5、對一批商品進行質量檢驗,最適宜采用的方法是()

A.全面調查B.抽樣調查C.典型調查D.重點調查6、抽樣調查的主要目的是()

A.計算和控制抽樣誤差B.推斷總體數量特征

C.對調查單位作深入研究D.廣泛運用數學方法60了解統計數據整理意義,熟悉整理的原則和內容,并能進行預處理掌握分組的概念、特點和原則,了解分組的種類掌握頻數分布的概念,熟悉頻數分布的編制方法掌握組限的表現形式、組距和組中值的計算掌握統計表的含義及其構成,熟悉統計表的編制學習目的和要求

1第三節統計數據的整理61分組的概念原則分組的作用頻數分布的概念及其構成組距和組中值的計算統計表的編制方法和原則學習重點262統計分組的方法頻數分布的編制學習難點3一、統計整理的意義和內容資料的積累和保管審核原始資料對數據的分組、匯總繪制統計圖表整理的中心工作顯示數據的基本特征深入分析的基礎起著承前啟后的作用統計整理的內容數據排序二、統計分組的意義和作用(一)統計分組的意義根據統計研究的需要,將總體按照一定的標志區分為若干個組成部分的一種統計方法。目的:突出組內同質性、組間差異性65(二)統計分組的作用劃分現象的類型揭示現象內部結構分析現象之間的依存關系根據研究問題的目的來選擇選擇最能反映被研究現象本質特征的標志分組標志數量標志品質標志三、分組標志的選擇簡單分組復合分組對總體只按一個標志分組;只反映現象在某一標志特征上的差異選擇兩個及以上標志層疊起來分組;從不同角度反映總體內部的差異分組體系用一系列標志對總體的多種分組結合成的體系。四、(一)按分組標志的多少四、統計分組的種類68牲畜按經濟用途分組牲畜按經濟用途、性別分組簡單分組

復合分組

舉例:69分組體系70(二)按分組任務和作用的不同71(三)一、分配數列的概念和種類:某地區從業勞動者產業分組統計第四節頻數分布

構成要素:總體按某標志所分的組和各組對應的單位數。

反映總體結構分布狀況及特征總體的各個組各組的單位數(頻數)、頻率73單項式變量數列實例

表3-4某市居民家庭按家庭人口數分組

74品質分配數列數值變量分配數列單項式分配數列組距分配數列分配數列種類(由品質標志分組)(由數量標志分組)等距數列不等距數列75表3-2某高校在校生性別狀況分組表品質變量分配實例數值變量分配數列實例表3-3

某市餐飲業按營業額分組

76組距式變量數列實例

表3-5某車間工人按月工資分組

77說明:二、組距數列的編制調查得到40家個體餐飲企業上月的營業額如下(元):

899、975、1258、1879、1988、2270、2593、2889、3012、34583598、3688、3954、4015、4115、4228、4332、4402、4557、4682、4689、4794、4856、5105、5112、5234、5581、5622、5645、5876、5987、6078、6250、6315、6384、6572、6850、7224、7753、8874

順序排列數字資料,觀察其中的集中與變異情況,確定數列形式,計算全距全距=8874–899=7975確定組數、組距、組限(等距分組)(一)組距和組數分多少組合適可按照斯特格斯的經驗公式計算:組數K=1+lgN/lg2。分多少組合適可按照斯特格斯的經驗公式計算:組數K=1+lgN/lg2。

實際分組時,主要通過定性分析來確定組數。79R-全距K-組數i-組距組距=(最大值-最小值)/組數在實際應用中,組距應是5或10的整倍數。而且第一組的下限要低于最小變量值,最后一組的上限應大于最大變量值。例子見教材P31.計算各組頻數、頻率(等距分組)

(二)等距分組和不等距分組頻數(率)密度=頻數(率)/組距(異距分組)等距分組不等距分組各組組距均相等。如:

10—2020—3030—40以上各組組距均為10。這種分組適用于均勻分布的總體。各組組距不一定相等。如:

10—2020—5050—6060—70以上分組中,其中第二組與其它各組的組距不同。這種分組適用于資料分布離差較大或者是為了滿足特殊的研究目的的需要。(三)組限和組中值

1、組限組限就是每一組兩端的數值。

10—2020—3030—40下限上限確定組限的方法有兩種:間斷式確定和重疊式確定職工人數(人)

99以下

100—199200—299300—399固定資產額(萬元)

50—6060—7070—8080—90間斷式確定組限適用于離散變量重疊式確定組限適用于連續變量84比如60這一數值不計算在50~60這一組內,而是計算在60~70組中?!鋈绾未_定組限重疊組限----“上組限不在內”原則

分組所遵循的原則是“不漏不重”。不漏:組下限≤數據的最小值;組上限≥數據的最大值;不重:可采用相鄰兩組組限間斷的辦法(如[6-10],[11-15]等);可采用相鄰兩組組限重疊,根據“上限不在內原則”(如[5,10),[10,15)等)。2、組中值每組上限與下限之間的中點數值,是各組的假定平均數。并不是各組標志值的平均數,它很難計算出來,常用組中值近似地代替。僅存在于組距式分組數列中。單項式分組中沒有組中值。組中值

=(上限值+下限值)÷2開口組組中值的計算:缺下限:組中值=本組上限—

相鄰組組距/2缺上限:組中值=本組下限+相鄰組組距/2例如產值(萬元)50以下50—6060—7070以上第一組組中值:50-(10÷2)=45最后一組組中值:70+(10÷2)=7586單項數列的編制適用范圍離散型變量,變量值的種數較少時。步驟將變量值排序

計算頻數和頻率

編制統計表單項數列的編制組距數列的編制適用范圍離散型變量,變量值的種數較多時;

連續型變量。87組距式數列編制步驟排序,確定最大值、最小值,計算全距確定組距數列類型。等距OR不等距?確定組數和組距?!瘛瘛瘛瘛瘛翊_定組限和組限表示方法。同限OR異限?計算頻數、頻率,編制統計表從變量值低的組開始,將各組次數(頻率)逐次向變量值高的組累計,說明某一組上限以下各組的累計次數(頻率)。從變量值高的組開始,將各組次數(頻率)逐次向變量值低的組累計,說明某一組下限以上各組的累計次數(頻率)。向上累計向下累計三、累計次數分布(重在理解會求)89累計次數分布數列的編制實例[例3-2]根據例3-1編制的累計次數分布表如下:表3-7某車間工人日產零件累計分組表(一)鐘型分布四、次數分布的主要類型鐘型分布的特征是“兩頭小,中間大”,即靠近中間的變量值分布的次數多,靠近兩邊的變量值分布的次數少,其曲線圖宛如一口鐘,如右圖所示。鐘形分布91(二)U型分布

U型分布的形狀與鐘型分布相反,靠近中間的變量值分布次數少,靠近兩端的變量值分布次數多,形成“兩頭大,中間小”的U型分布。如人口死亡率分布,人口總體中,幼兒和老人死亡率高,而中青年死亡率低。如下圖所示。U

U形分布92(三)J型分布J形分布

J型分布有兩種類型,一種是次數隨著變量的增大而增多。另一種呈反J型分布,即次數隨著變量增大而減少。如下圖93(四)洛倫茲分布

專門用于檢定社會收入分配的平等程度。洛倫茲曲線拓展可運用于其他社會經濟現象,研究總體各單位標志分布的集中狀況或平均性。其運作的條件是:現在總體的各組頻率與相應的各組標志總量的比重。表5.1各類節目收視情況統計表一、統計表賓詞總標題縱欄標題橫行標題數值主詞第五節統計圖表統計表的構成95說明:(1)由上表我們可以看出,統計表一般由四個主要部分構成:表頭、行標題、列標題、數字資料,必要時可在表的下面加上表外附加。(2)表頭應放在表的上方,用來說明統計表的主要內容(3)行標題和列標題通常放在統計表的第一列和第一行,表示所研究問題的類別名稱和指標名稱,通常被稱為類。(4)若是時間序列數據,行標題和列標題也可以是時間,數據較多時,通常將時間放在行標題的位置。(5)表外附加通常在表的下方,主要包括資料來源、指標的解釋和必要的說明等內容。

統計表的種類復合表簡單表分組表主詞未經任何分組的統計表主詞按一個標志分組的統計表主詞按兩個及以上標志分組的統計表A:根據主次是否分組及分組的情況分為97我國城鄉居民家庭人均收入

簡單表主詞

賓詞

98按兩個或兩個以上特征或標志結合起來分組。表2-9某省某工廠1994、1998年四項檢測指標異常檢出率

:TTT(麝香草酚濁度試驗),:GPT(谷丙轉氨酶)。

(丁建生等.中國衛生統計1999;16(3):166)復合表99分析表調查表匯總表B:根據統計表作用的不同分為統計表的設計注意事項(1)合理安排統計表的結構。行標題、列標題及數字資料的位置合理。(2)表頭一般應包括表號、總標題和表中數據的單位等內容。(3)表中的上下兩條橫線一般用粗線,中間的其他線用細線。通常,統計表的左右兩邊不封口,列標題之間一般用豎線隔開,行標題不用。表中,盡量少用橫豎線。數據一般右對齊。二、統計圖:1.直方圖折線圖營業額(元)企業個數410862折線圖是將直方圖的各條形中點用線連接起來而得到。直方圖是用矩形的寬度和高度表示頻數分布2.曲線圖鐘形分布J形分布U形分布3.條形圖用長短或高矮來顯示數值的大小4.餅形圖是以圓形的分割來表示總體的分組及結構1045.莖葉圖105莖葉顯示(Stem-and-leafdisplay):一種探索性數據分析技術,同時排列定量數據順序并提供其分布形態的相關信息。莖葉圖由兩部分組成:莖(stem):通常由每組數的高位數值(leadingdigits)形成,按組豎立在左邊;葉(leaf):通常由每組數的低位數值(lastdigits)形成,按組橫排在“莖”的右邊。

通過莖葉圖,我們可以看出數據的分布形狀及數據的離散情況,比如,分布是否對稱,數據是否集中,是否有極端值等。

莖葉圖的關鍵是如何設計好樹莖。樹莖一旦確定,樹葉就自然長著了相應的樹莖上了。106看一個例子:107例如1081096.散點圖散點圖:用點的密集程度和趨勢表示兩種現象間的相關關系。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論