第2章統計數據的收集、整理與顯示 2_第1頁
第2章統計數據的收集、整理與顯示 2_第2頁
第2章統計數據的收集、整理與顯示 2_第3頁
第2章統計數據的收集、整理與顯示 2_第4頁
第2章統計數據的收集、整理與顯示 2_第5頁
已閱讀5頁,還剩178頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1byJinLin@ZNUFE某大學學生工作部門想了解本校大學生上網的情況,打算采用問卷的方式,匿名調查。會計學專業的李萍同學提供了如下的問卷內容:1、你的性別()

A、男B、女2、你所在的年級()

A、大一B、大二C、大三D、大四3、你平均每天上網的時間大概是多長?()

A、1個小時以下(包括不上網)B、1-2個小時

C、2-5個小時D、5個小時以上4、你主要是為了什么而上網?()(此題可多選)

A、瀏覽網頁B、收發電子郵件C、玩游戲D、交友聊天

E、下載軟件或資料F、跟帖灌水G、娛樂休閑5、你最感興趣的是以下哪些方面的內容?()

A、新聞時事B、校友錄

C、娛樂D、體育6、你認為上網與學習的關系是怎樣的?()

A、上網耽誤學習B、上網可促進學習

C、可以增強綜合素質D、其他2byJinLin@ZNUFE由這份問卷我們想知道如下的問題:1.上述問卷的設計原則是什么?2.問題的設計應該注意哪些方面?3.答案的設計應該遵循什么原則?4.得到了資料是不是馬上就可以進行分析了?3byJinLin@ZNUFE一、間接數據的來源二、直接數據的來源4byJinLin@ZNUFE

間接數據主要是從公開渠道獲得的數據,如:公開出版的報紙、書籍網站中的數據,有些未公開的數據在獲得數據所有者允許的情況下也可以使用。

5byJinLin@ZNUFE刊登我國年度宏觀數據的刊物主要是國家、地區和行業或部門的年鑒。例如:《中國統計年鑒》《中國統計摘要》《中國經濟年鑒》《中國農村統計年鑒》《中國城市統計年鑒》《中國社會統計年鑒》《中國人口統計年鑒》《中國勞動統計年鑒》《中國工業經濟統計年鑒》《中國財政年鑒》《中國金融年鑒》全國各省、市、自治區、直轄市、新疆生產建設兵團的統計年鑒等。6byJinLin@ZNUFE

對于某些特定行業的數據,如證券業數據,我們可以從:各證券報中國證券監督管理委員會上海證券交易所深圳證券交易所各證券公司等單位的網站數據庫和出版發行的刊物中取得有關數據。各上市公司的季報、半年報、年報中的各種數據屬于公開數據,可以直接使用,但如果存在后續的補充報告,在使用時應該及時調整。對于未公開的微觀經濟數據,由于涉及企業的內部機密或個人的隱私權,我們在采用有關數據時一定要征得相關單位和個人的同意,在發表研究成果時還應盡量避免直接公布原始數據。7byJinLin@ZNUFE刊登世界各國宏觀數據的刊物主要由:聯合國統計司(UNSD)世界銀行(WB)、國際貨幣基金組織(IMF)世界貿易組織(WTO)、世界衛生組織(WHO)國際能源機構(IEA)國際清算銀行(BIS)歐盟統計局(EUROSTAT)亞洲開發銀行(ADB)國際電信聯盟(ITU)等國際性組織編制出版。有些使用面廣的資料,在取得版權后,由我國有關機構翻譯成中文出版。例如:《世界經濟年鑒》《世界發展報告》《國外經濟統計資料》等。8byJinLin@ZNUFE(1)應根據研究目的選擇間接數據;(2)注意間接數據變量名稱的含義是否發生過變化。隨著歷史的變遷,有些間接數據變量名稱的內涵或外延發生了變化,在采用數據時應該進行調整;(3)注意間接數據的計算口徑和計算方法是否一致;(4)注意尊重間接數據所有者的權益。一是要合法采用間接數據;二是要注明數據的來源出處,這樣既尊重他人的勞動成果,又便于閱讀者核實。9byJinLin@ZNUFE收集容易,采集成本低作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗和回答某些疑問和假設尋找研究問題的思路和途徑收集二手資料在研究中應優先考慮byJinLin@ZNUFE調查數據通過調查方法獲得的數據通常是對社會現象而言通常取自有限總體實驗數據通過實驗方法得到的數據通常是對自然現象而言也被廣泛運用到社會科學中,如:心理學、教育學、社會學、經濟學、管理學等byJinLin@ZNUFE統計調查方式普查典型調查重點調查抽樣調查統計報表調查12byJinLin@ZNUFE普查是國家為了詳細地了解某項重要的國情國力而專門組織的一次性全面調查,主要用來調查屬于一定時點上現象的總體特征,如:全國人口普查國有資產普查全國工業普查、全國第三產業普查等。相對于全面統計報表,普查能取得內容更詳盡、分類更細致的統計資料,但普查耗費的人力、物力、財力較多,不宜經常進行,而應根據實際需要間隔一定的時間進行,比如:我國從1990年起每隔10年進行一次全國人口普查。13byJinLin@ZNUFE(1)要規定統一的標準時點;(2)嚴格設定必需的調查項目;(3)盡可能地縮短普查登記期限;(4)按一定的周期進行同類普查。14byJinLin@ZNUFE

統計報表調查是指按照國家統一規定的表格形式、統一的指標、統一的報送程序和報送時間,自下而上逐級提供基本統計資料的一種調查組織形式。我國現行的統計報表,包括國民經濟基本統計報表和專業統計報表。15byJinLin@ZNUFE(1)在報表實施范圍內,各報告單位按期報送,可保證調查資料的全面性、連續性和及時性;(2)統計報表調查事先已作為一種制度布置到基層報告單位,要求各單位根據原始記錄和統計臺賬提供報表所需的資料,從而保證了資料來源的可靠性和準確性;(3)由于統計報表調查是逐級整理上報,統計資料可以使各級地方政府和部門及時了解和掌握本地區、本部門的基本情況。16byJinLin@ZNUFE1、涉及的范圍廣、內容多,花費的人力、物力較多;2、在統計法制不健全、執行不嚴的情況下,統計報表調查在逐級上報過程中容易受到有關人員主觀因素的干擾,從而影響資料的準確性;3、統計報表中的指標項目相對固定,當被研究現象變化較快時,統計報表缺乏應有的靈活性。17byJinLin@ZNUFE抽樣調查是一種非常重要的非全面調查組織形式。它是按照隨機原則從被研究的總體中抽取一部分單位組成樣本,根據樣本的調查結果對總體的數量特征作出具有一定可靠程度的推斷的一種統計調查方式。隨機原則是抽樣調查所必須遵循的基本原則,它是指在抽樣過程中,樣本單位的抽取不能受任何主觀因素及其他系統因素的影響,保證總體中各個單位都有同等的機會被抽選出來的原則。只有遵循隨機原則,才能保證抽選出來的樣本單位的分布近似于總體的分布,從而確保樣本對總體的代表性。18byJinLin@ZNUFE總體樣本隨機抽樣樣本數據特征以一定概率推斷總體數據特征描述統計方法推斷統計方法19byJinLin@ZNUFE從總體中隨機抽取樣本單位。抽樣調查的目的是根據樣本的數量特征推斷總體的數量特征。抽樣誤差可以事先計算并且加以控制。具有經濟性、時效性強、適應面廣、準確性高等20byJinLin@ZNUFE重點調查是在調查對象中選擇一部分重點單位進行調查,用以反映總體基本或大致情況的一種非全面調查。重點單位是相對于調查的標志而言的,即這部分單位的標志值之和占調查總體的標志值總和的比重較大,往往是總體中具有舉足輕重的單位。如果調查研究的目的只在于了解總體的大致情況,就可以采用重點調查。21byJinLin@ZNUFE典型調查是根據調查目的與要求,在對所研究現象進行全面分析的基礎上,有意識地選擇有代表性或具有典型意義的單位進行深入調查,以便認識事物的本質與規律的一種非全面調查。對具有代表性的單位進行典型調查,可以對總體的一般情況進行推論。對具有典型意義的單位進行調查,可以分析新情況或新問題。byJinLin@ZNUFE23byJinLin@ZNUFE調查者與被調查者通過面對面地交談而獲得資料有標準式訪問和非標準式訪問標準式訪問通常按事先設計好的問卷進行非標準式訪問事先一般不制作問卷對不起,打擾了!byJinLin@ZNUFE也稱郵寄問卷調查,是一種標準化調查調查者與被調查者沒有直接的語言交流,信息的傳遞依賴于問卷通過某種方式將調查表或問卷送至某調查者手中,由被調查者填寫,然后將問卷寄回指定收集點問卷或表格的發放方式有郵寄、宣傳媒介傳送、專門場所分發三種

byJinLin@ZNUFE德爾菲法是指按照規定的程序,采用郵寄或電子郵件的方式,反復多次地收集各地專家的看法,使不同意見趨于一致的調查方法。德爾菲法有匿名性、定量化和輪回反饋式等特點。專家們互不通氣,匿名發表意見,便于獲得真實有效的資料。反復地詢問也能使調查結果更加準確可靠。實施這種方法的一般步驟為:擬定意見征詢表、選定適量的征詢專家、分幾輪征詢專家的意見、進行資料的處理等,最后作出調查結論。26byJinLin@ZNUFE也稱集體訪談將一組被調查者集中在調查現場,讓他們對調查的主題發表意見以獲得資料參加座談會的人數不宜過多,一般為6~10人側重于定性研究byJinLin@ZNUFE一次只有一名受訪者參加、針對特殊問題的調查適合于較隱秘的問題,如個人隱私問題;或較敏感的問題,如政治方面的問題側重于定性研究byJinLin@ZNUFE調查者利用電話與被調查者進行語言交流以獲得信息時效快、成本低問題的數量不宜過多

您好!我是××調查公司的調查員…byJinLin@ZNUFE又稱電腦輔助電話調查電腦與電話相結合完成調查的全過程一般需借助專門的軟件進行硬件設備要求較高 問卷byJinLin@ZNUFE網絡調查(又稱網上調查)是指利用國際互聯網作為技術載體和信息交換平臺進行調查的數據搜集方法。網絡調查具有匿名性、成本低、速度快、調查對象廣泛等特點,調查結果相對可靠。現在電子郵件調查、網頁調查、免費下載工具調查、民意調查、超前性問題調查等已被廣泛使用。網上調查存在結果的可信度不高、代表性差、難以消除重復填報等問題。31byJinLin@ZNUFE就調查對象的行動和意識,調查人員邊觀察邊記錄以收集所需信息調查人員不是強行介入能夠在被調查者不察覺的情況下獲得資料byJinLin@ZNUFE在設定的特殊實驗場所、特殊狀態下,對調查對象進行實驗以獲得所需資料有室內實驗法和市場實驗法byJinLin@ZNUFE一、調查方案的結構二、調查問卷設計byJinLin@ZNUFEbyJinLin@ZNUFE調查要達到的具體目標回答“為什么調查?”調查之前必須明確byJinLin@ZNUFE調查對象:調查研究的總體或調查范圍調查單位:需要對之進行調查的單位。可以是調查對象的全部單位(全面調查),也可以是調查對象中的一部分單位(非全面調查)回答“向誰調查?”調查對象調查單位byJinLin@ZNUFE調查的具體內容通常表現為表格或問卷回答“調查什么?”Q1…………Q2…………Q3…………Q4…………byJinLin@ZNUFE用來搜集調查數據的一種工具調查者根據調查目的和要求所設計的,由一系列問題、備選答案、說明以及碼表組成的一種調查形式不同的調查問卷在具體結構、題型、措詞、版式等設計上會有所不同,但在結構上一般都由開頭部分、甄別部分、主體部分和背景部分組成byJinLin@ZNUFE明確調查所采用的方法確定調查資料的所屬時間和調查工作的期限調查的組織與實施細則byJinLin@ZNUFE開頭部分甄別部分主體部分背景部分問候語填寫說明問卷編號問卷的基本結構byJinLin@ZNUFE××女士/小姐/先生您好!我是××市場調查公司訪問員,我們正在進行一項有關公眾醫療保險意識方面的調查,目的是想了解人們對醫療保險的看法和意見,以便更好地促進醫療保險事業的發展。您的回答無所謂對錯,只要真實地反映了您的情況和看法,就達到了這次調查的目的。希望您能積極參與,我們對您的回答完全是保密的。調查要耽擱您一些時間,請您諒解。謝謝您的支持與合作!byJinLin@ZNUFE填寫要求:請您在所選擇答案的題號上畫圈對只許選擇一個答案的問題只能畫一個圈;對可選多個答案的問題,請在你認為合適的答案上畫圈需填寫數字的題目在留出的橫線上填寫對于表格中選擇答案的題目,在所選的欄目內畫勾對注明要求您自己填寫的內容,請在規定的地方填上您的意見byJinLin@ZNUFE用于識別問卷、調查者、被調查者姓名和地址等便于校對檢查、更正錯誤問卷編號001byJinLin@ZNUFE甄別也稱為過濾,它是先對被調查者進行過濾,篩選掉不需要的部分,然后針對特定的被調查者進行調查通過甄別,可以篩選掉與調查事項有直接關系的人,以達到避嫌的目的可以確定哪些人是合格的被調查者,哪些人不是甄別的目的是確保被調查者合格,能夠作為該市場調查項目的代表,從而符合調查研究的需要byJinLin@ZNUFES1.請問您或您的家庭有沒有在下列行業工作的呢?

1.廣告、公關機構…………………2.市場研究、咨詢、調查機構……3.電視,廣播,報紙等媒介機構…終止訪問

4.轎車制造…………5.轎車批發、零售…………………6.以上皆無…………繼續訪問S2.請問您的年齡是:

1.20歲以下………終止訪問

2.20歲~30歲

3.30歲~40歲

4.40歲~50歲

5.50歲以上………終止訪問byJinLin@ZNUFE是調查問卷的核心內容包括所要調查的全部問題,主要由問題和答案所組成Q1.您在購買汽車時主要考慮哪些因素?Q2.您認為這款汽車的加速性能怎么樣?byJinLin@ZNUFE通常放在問卷的最后,主要是有關被調查者的一些背景資料該部分所包含的各項問題,可使研究者根據背景資料對被調查者進行分類比較分析1.您具體做什么工作?2.您的受教育程度?byJinLin@ZNUFE

A.[出示卡片]請問您的教育程度?(901)

沒受過正式教育………1

小學,初中…………2

高中,職高,中專,技校……3

大專,大學或以上………………4

B.[出示卡片]請問您的職業和職位是什么?(902)

普通職員,工人……1

部門經理負責人//高級管理人員……………2

公司老板,廠長,總經理………3

專業人員……………4

個體戶,自營職業………………5

失業,待業…………6

學生……………………7

離退休人員…………8

其他(請注明)………9byJinLin@ZNUFE提問的內容盡可能短用詞要確切、通俗可按6W準則加以推敲。6W即Who(誰),Where(何處),When(何時),Why(為什么),What(什么事),How(如何)一項提問只包含一項內容避免誘導性提問避免否定形式的提問避免敏感性問題byJinLin@ZNUFE請問您使用什么牌子的洗發水?請問您最近三個月使用什么牌子的洗發水?您最近一段時間使用什么品牌的化妝品?您最近一個月使用什么品牌的化妝品?您覺得這種電視機的畫面質量怎么樣?您認為這種電視機的畫面是否清晰?byJinLin@ZNUFE您覺得這種新款轎車的加速性能和制動性能怎么樣?您覺得這種新款轎車的加速性能怎么樣?您覺得這種新款轎車的制動性能怎么樣?byJinLin@ZNUFE人們認為長虹牌彩電質量不錯,你覺得怎么樣?您覺得長虹牌彩電的質量怎么樣?byJinLin@ZNUFE您覺得這種產品的新包裝不美觀嗎?您覺得這種產品的新包裝美觀嗎?byJinLin@ZNUFE回答的類型與方法開放性問題(自由回答型)封閉性問題(選擇回答型)兩項選擇法多項選擇法順序選擇法評定尺度法雙向列聯法限制選擇型多項選擇型單項選擇型byJinLin@ZNUFE對問題的回答未提供任何具體的答案,由被調查者根據自己的想法自由作出回答屬于自由回答型優點:比較靈活,適合于搜集更深層次的信息,特別適合于那些尚未弄清各種可能答案或潛在答案類型較多的問題。而且可以使被調查者充分表達自己的意見和想法,有利于被調查者發揮自己的創造缺點:由于會出現各種各樣的答案,給調查后的資料整理帶來一定困難byJinLin@ZNUFE您認為我國目前的廣告宣傳中,存在的主要問題是什么?

您對這種捷達新款車有何更具體的看法?

byJinLin@ZNUFE對問題事先設計出了各種可能的答案,由被調查者從中選擇問題的答案是標準化的,有利于被調查者對問題的理解和回答,也有利于調查后的資料整理對答案的要求較高,對一些比較復雜的問題,有時很難把答案設計周全問題的答案是選擇回答型,所以設計出的答案一定要窮盡和互斥回答方法有:兩項選擇法、多項選擇法、順序選擇法、評定尺度法、雙向列聯法五種byJinLin@ZNUFE答案只有兩項,要求被調查者選擇其中之一來回答優點:被調查者只需在二者之中選擇一項,回答比較容易;調查后的數據處理也很方便缺點:得到的信息量較少;當被調查者對兩項答案均不滿意時,很難作出回答您有手機嗎?

1.有2.沒有byJinLin@ZNUFE在設計問卷時,對一個問題給出三個或三個以上的答案,讓被調查者從中選擇進行回答根據要求選擇的答案多少不同,有以下類型單項選擇型:要求被調查者對所給出的問題答案選擇其中的一項多項選擇型:要求被調查者對所給出的問題答案中,選出自己認為合適的答案,數量不受限制限制選擇型:要求被調查者在所給出的問題答案中,選出自己認為合適的答案,但數量要受一定限制byJinLin@ZNUFE單項選擇型

您覺得哪種類型的廣告宣傳效果最好?

(選一項)1.電視廣告

2.廣播廣告

3.雜志廣告

4.報紙廣告

5.路牌廣告byJinLin@ZNUFE多項選擇型

請問您在購買小轎車時,主要考慮哪些因素?

(選出您認為合適的答案)1.價格6.維修費用

2.款式7.乘坐舒適

3.品牌8.行使平穩

4.耗油量9.加速性能

5.售后服務10.制動性能byJinLin@ZNUFE問題答案有多個,要求被調查者在回答時,對所選的答案按要求的順序或重要程度加以排列。其中,對所選的的答案數量可以進行一定的限制,也可以不進行限制問題答案不僅可以反映所要調查的內容,而且可以反映出被調查者對問題的看法,從而增加了信息量

您在購買這種牌子的電視機時,主要是考慮哪些因素?

1.產品的品牌

2.價格合理

3.售后服務

4.外形美觀

5.維修方便(按重要程度進行排序)byJinLin@ZNUFE問題答案,由表示不同等級的形容詞組成,并按照一定的程度排序,由被調查者依次選擇。您對這種新款轎車是否感到滿意?

1.非常滿意;2.比較滿意;3.一般

4.不太滿意;5.不滿意。byJinLin@ZNUFE將兩類不同問題綜合到一起,通常用表格來表現表的橫向是一類問題,縱向是另一類問題這種問題結構可以反映兩方面因素的綜合作用,提供單一類型問題無法提供的信息可以節省問卷的篇幅byJinLin@ZNUFE請在您贊同項目的空格內劃“√”byJinLin@ZNUFE問題的安排應具有邏輯性問題的順序應先易后難能引起被調查者興趣的問題放在前面開放性問題放在后面版面格式的設計問卷的結構安排要合理,問卷的主體部分要突出、醒目不要編排過密,各問題之間要留出一定的空間外表及內容的印刷要美觀byJinLin@ZNUFE一、數據的誤差二、數據的質量要求byJinLin@ZNUFEbyJinLin@ZNUFE由于抽樣的隨機性所帶來的誤差所有樣本可能的結果與總體真值之間的平均性差異影響抽樣誤差的大小的因素樣本量的大小總體的變異性byJinLin@ZNUFE相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結果與總體真值之間的差異存在于所有的調查之中概率抽樣,非概率抽樣,全面性調查有抽樣框誤差、回答誤差、無回答誤差、調查員誤差、測量誤差byJinLin@ZNUFE抽樣誤差可計算和控制非抽樣誤差的控制調查員的挑選調查員的培訓督導員的調查專業水平調查過程控制調查結果進行檢驗、評估現場調查人員進行獎懲的制度byJinLin@ZNUFE1.精度:最低的抽樣誤差或隨機誤差2.準確性:最小的非抽樣誤差或偏差3.關聯性:滿足用戶決策、管理和研究的需要4.及時性:在最短的時間里取得并公布數據5.一致性:保持時間序列的可比性6.最低成本:以最經濟的方式取得數據byJinLin@ZNUFE1.瀏覽國家統計局網站/,獲得一組普查數據,一組專題數據(.xls),要求:一個工作薄,兩個工作表,并改名普查數據和專題數據調整格式,易于瀏覽2.選擇一個感興趣的領域,設計一份調查問卷(.doc)。要求:問卷結構完整(開頭,主體,調查情況的記錄)有開放式和封閉式問題,有雙向列聯表,封閉式問題中包含各種類型,格式要美觀byJinLin@ZNUFE一、統計數據的審核二、品質數據的整理與展示三、數值型數據的整理四、數值型數據的圖示80byJinLin@ZNUFE數據審核檢查數據中的錯誤數據篩選找出符合條件的數據數據排序升序和降序尋找數據的基本特征byJinLin@ZNUFE審核的內容及時性檢查就是檢查需要的統計數據是否在規定的時間內已經上報到調查機構,缺一、兩個單位的資料都會影響整個匯總工作。完整性審核檢查應調查的單位或個體是否有遺漏所有的調查項目或指標是否填寫齊全準確性審核檢查數據是否真實反映客觀實際情況,內容是否符合實際檢查數據是否有錯誤,計算是否正確等byJinLin@ZNUFE適用性審核弄清楚數據的來源、數據的口徑以及有關的背景材料確定數據是否符合自己分析研究的需要時效性審核盡可能使用最新的數據確認是否有必要做進一步的加工整理Excel中數據有效性檢查byJinLin@ZNUFE當數據中的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,需要對數據進行篩選數據篩選的內容將某些不符合要求的數據或有明顯錯誤的數據予以剔除將符合某種特定條件的數據篩選出來,而不符合特定條件的數據予以剔除byJinLin@ZNUFE用Excel進行數據篩選

8名學生的考試成績數據byJinLin@ZNUFE按一定順序將數據排列,以發現一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數據檢查糾錯,以及為重新歸類或分組等提供依據在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成byJinLin@ZNUFE分類數據的排序字母型數據,排序有升序降序之分,但習慣上用升序漢字型數據,可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分數值型數據的排序遞增排序:設一組數據為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)byJinLin@ZNUFE

(一)分類數據的整理與展示(二)順序數據的整理與展示byJinLin@ZNUFE要弄清所面對的數據類型,因為不同類型的數據,所采取的處理方式和方法是不同的對分類數據和順序數據主要是作分類整理對數值型數據則主要是作分組整理適合于低層次數據的整理和顯示方法也適合于高層次的數據;但適合于高層次數據的整理和顯示方法并不適合于低層次的數據byJinLin@ZNUFE1.頻數和頻數分布頻數是指落在某類中的數據個數,又稱為次數。在分類的基礎上,將總體的所有單位按類進行整理,形成總體單位在各組間的分布,稱為頻數分布或次數分布。頻數分布的構成要素有兩個:一是品質變量的各種具體表現或數量變量值所形成的組。二是與各個組相對應的總體單位數,即頻數;或各組單位數占總體單位總數的比重,即頻率,它可以用百分數表示,也可以用小數表示。93byJinLin@ZNUFE頻數分布可以用表格的形式反映,也可以用圖形來表現。用表格來反映的稱為頻數分布表,而用圖表現的稱為頻數分布圖。例2.18某醬油企業為了解本公司產品在當地的市場占有率,組織了專門的市場調查小組,調查員在隨機抽取一家超市后,對某天上午的60名顧客購買的醬油品牌進行了登記,原始數據如下:94byJinLin@ZNUFE95byJinLin@ZNUFE要利用Excel編制分類數據的頻數分布表,需要把各類用一個數字代碼來表示。在本例中,各類指定的代碼是:1—李錦記;2—美味鮮;3—海天;4—珠江橋;5—金獅;6—加加。在Excel中,將各品牌代碼輸入到Excel工作表的A1:A60,并將所有品牌的代碼單作一列,為“接收區域”,即工作表的C3:C8。96byJinLin@ZNUFE第一步:在“工具”下拉菜單中選擇“數據分析”。第二步:在“數據分析”的選擇欄中選擇“直方圖”,單擊“確定”項。第三步:用鼠標圈定或鍵盤輸入對話框“輸入區域”框中的數據區域(本例為A1:A60)。用鼠標圈定或鍵盤輸入對話框“接收區域”框中的代碼區域(本例為C3:C8);在“輸出選項”中選擇“輸出區域”并鍵入結果輸出的區域(本例為D2);選擇“圖表輸出”;在這里暫不選擇“Pareto圖”和“累積百分率”。點擊“確定”選項。97byJinLin@ZNUFE98Excel輸出的結果為:byJinLin@ZNUFE輸入區域在此輸入待分析數據區域的單元格引用。接收區域(可選)在此輸入接收區域的單元格引用,該區域包含一組可選的用來定義接收區域的邊界值。這些值應當按升序排列。MicrosoftExcel將統計在當前邊界值和相鄰的較高邊界值之間的數據點個數(如果存在)。如果數值等于或小于邊界值,則該值將被歸到以該邊界值為上限的區域中進行計數。所有小于第一個邊界值的數值將一同計數,同樣所有大于最后一個邊界值的數值也將一同計數。如果省略此處的接收區域,MicrosoftExcel將在數據的最小值和最大值之間創建一組均勻分布的接收區間。標志如果輸入區域的第一行或第一列中包含標志項,請選中此復選框。如果輸入區域沒有標志項,請清除此復選框,MicrosoftExcel將在輸出表中生成適宜的數據標志。byJinLin@ZNUFE輸出區域在此輸入對輸出表左上角單元格的引用。如果輸出表將覆蓋已有的數據,MicrosoftExcel會自動確定輸出區域的大小并顯示一則消息。新工作表組單擊此選項可在當前工作簿中插入新工作表,并由新工作表的A1單元格開始粘貼計算結果。若要為新工作表命名,請在右側的框中鍵入名稱。新工作簿單擊此選項可創建一新工作簿,并在新工作簿的新工作表中粘貼計算結果。柏拉圖選中此復選框可在輸出表中按降序來顯示數據。如果此復選框被清除,MicrosoftExcel將只按升序來顯示數據并省略最右邊包含排序數據的三列數據。累積百分率選中此復選框可在輸出表中生成一列累積百分比值,并在直方圖中包含一條累積百分比線。如果清除此選項,則會省略累積百分比。圖表輸出選中此復選框可在輸出表中生成一個嵌入直方圖。byJinLin@ZNUFE為了便于閱讀,可用品牌名稱代替表2-2中的“接收”,用頻數代替表中的“頻率”,用各品牌的名稱代替其品牌代碼,用“合計”代替表中“其他”,將頻數總和60輸入到I9中,并計算出各自的比例和百分比,結果如下表所示:101byJinLin@ZNUFE分類數據的圖示方法主要包括條形圖、對比條形圖和餅圖。(1)條形圖(柱形圖)用寬度相同的條形的高度或長短來表示各類別數據的圖形有單式條形圖、復式條形圖等形式主要用于反映分類數據的頻數分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖102byJinLin@ZNUFE103byJinLin@ZNUFE104byJinLin@ZNUFE當分類變量在不同時間或空間上有多個值時,為表明它們各自在不同時間或空間上的變化情況,可繪制對比條形圖。在Excel“圖表向導”的“條形圖”中,選擇子圖表類型的一個即可。例2.19某飲料批發部經營的4種飲料第二、三季度銷售情況如表2-4所示:105byJinLin@ZNUFE106byJinLin@ZNUFE也稱圓形圖,是用圓形及圓內扇形的角度來表示數值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結構性問題十分有用繪制圓形圖時,總體中各部分所占的百分比用圓內的各個扇形角度表示,這些扇形的中心角度,是按各部分數據百分比占360°的相應比例確定的107byJinLin@ZNUFE108byJinLin@ZNUFE1. 列出各類別2.計算各類別的頻數3.制作頻數分布表4.用圖形顯示數據byJinLin@ZNUFE頻數(frequency):落在各類別中的數據個數比例(proportion):某一類別數據占全部數據的比值百分比(percentage):將對比的基數作為100而計算的比值比率(ratio):不同類別數值的比值byJinLin@ZNUFE1.累計頻數和累計頻率累積頻數(cumulativefrequencies):各類別頻數的逐級累加累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加累計有向上累計和向下累計之分。從順序數據的最低一組逐級向最高一組累計頻數,稱為向上累計。從順序數據的最高一組逐級向最低一組累計頻數,稱為向下累計。112byJinLin@ZNUFE【例2.20】某縣為了解鄉鎮領導為百姓排憂解難的情況,研究人員抽取了甲乙兩個鄉鎮的居民,就“您對本鄉鎮領導為百姓排憂解難是否滿意”的問題,各調查了200個居民,結果如表2.5和表2.6所示:113byJinLin@ZNUFE114byJinLin@ZNUFE115byJinLin@ZNUFE(1)累計頻數分布圖(甲鄉鎮)116(a)向上累積(b)向下累積byJinLin@ZNUFE(1)累計頻數分布圖(乙鄉鎮)117(a)向上累積(b)向下累積byJinLin@ZNUFE環形圖中間有一個“空洞”,總體中的每一部分數據用環中的一段表示環形圖與圓形圖類似,但又有區別圓形圖只能顯示一個總體各部分所占的比例環形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環環形圖可用于結構比較研究環形圖主要用于展示分類和順序數據byJinLin@ZNUFE119byJinLin@ZNUFE1.數據分組的概念數據分組是根據被研究現象的特征和研究,按照一個或幾個重要變量,將原始數據劃分為性質不同的若干個組成部分的一種統計方法。2.數據分組應遵循的原則(1)科學性原則。(2)完備性原則。(3)互斥性原則。122byJinLin@ZNUFE分組方法等距分組異距分組單變量值分組組距分組byJinLin@ZNUFE1.將一個變量值作為一組2.適合于離散變量3.適合于變量值較少的情況byJinLin@ZNUFE將變量值的一個區間作為一組適合于連續變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~byJinLin@ZNUFE數據分組,還需要明確是采用單個變量值分組,還是采用由兩個變量值形成的區間(即組距)分組,這取決于各數量變量值(即變量值)的變動范圍。當變量值的變動范圍很小,即使用每個變量值作為一組,所得到的組數也只有少數幾個組時,則可采用單個變量值分組。如果變量值的變動范圍很大,采用單個變量值分組所得到的組數很多,難以反映總體的分布規律,則應該采用組距分組。126byJinLin@ZNUFE確定組數:組數的確定應以能夠顯示數據的分布特征和規律為目的。在實際分組時,可以按Sturges提出的經驗公式來確定組數K確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即

組距=(最大值-最小值)÷組數統計出各組的頻數并整理成頻數分布表byJinLin@ZNUFE1.下限(lowlimit):一個組的最小值2.上限(upperlimit):一個組的最大值3.組距(classwidth):上限與下限之差4.組中值(classmidpoint):下限與上限之間的中點值,計算組中值依據組的類型,有三種不同方法:閉口組組中值=(上限值+下限值)÷2無上限組組中值=下限值+相鄰組組距÷2無下限組組中值=上限值+相鄰組組距÷2byJinLin@ZNUFE129【例】已知某城市甲居民區80戶家庭2007年8月的人均通信支出額的資料,試編制這些家庭人均通信支出額的頻數分布表。表2-780戶家庭2007年8月的人均通信支出額單位:元byJinLin@ZNUFE【解】由于原始數據比較多,在對數據進行排序后,宜采用組距分組編制頻數分布表。(1)確定組數組數取決于原始數據中數據的多少和變量值極差的大小,極差等于數據中最大變量值與最小變量值之差,亦稱全距。一般而言,數據越多,極差越大,分組數目就應該越多一些。但根據慣例,人們很少使用少于6個或大于16個的分組數目。130byJinLin@ZNUFE根據Sturges經驗公式,經粗略觀察,80戶家庭人均通信支出額的資料接近于正態分布,由表可確定組數為7。經驗分組數目查對表131byJinLin@ZNUFE一般情況下,用兩個變量值組成的一個區間作為一個組時,該組的較小變量值叫下限,較大變量值叫上限,下限與上限之間的距離叫組距。如果相鄰兩個組的組限不相等,則有某組組距=本組上限—前組下限如果相鄰兩個組的組限相等,即本組下限等于前組上限時,可按式計算組距,即某組組距=本組上限-本組下限

132byJinLin@ZNUFE如果每個組的組距相等,叫等距分組。若各個組的組距不完全相等,叫不等距分組。采用等距分組,便于分析總體的內部結構,但也可以根據研究目的和資料的特殊性而采用不等距分組。在等距分組情況下,組數確定以后,組距也就基本確定了。組距、組數與極差之間的關系用公式表示即為:組距=極差÷組數

133byJinLin@ZNUFE組限即為相鄰兩組的界限,有下限和上限之分。變量的性質不同,組限的確定方法也不同。對于離散變量,相鄰組的組限相連但不重疊,即本期上限與后一組下限能按序連接,但不相等。比如,高等學校學生各個班的規模按人數分為:15~24人、25~34人、35~44人、45~54人、……對于連續變量,相鄰組的組限必須重疊,即本組上限等于后一組的下限,而本組下限又等于前一組的上限,以免遺漏數據,如考生按成績分組為:“50~60分”、“60~70分”、“70~80分”、“80~90分”、“90~100分”等。134byJinLin@ZNUFE實際工作中,有時為了方便,確定離散變量的組限時也按連續變量的組限確定方法處理。如果遇到某變量值剛好等于相鄰組的組限時,習慣上是將這個變量值歸入下限所在的一組,亦為“上組限不在內”原則,但最后一組的上限應包括在本組中。比如,甲考生的成績為70分,那么這個70分應歸入“70~80分”一組,而不是“60~70分”一組;若乙考生的成績為100分,剛好等于最后一組的上限,則應歸入“90~100分”一組。135byJinLin@ZNUFE如果資料中存在極小值或極大值,通常采用開口組,即第一組不取下限,最后一組不取上限。如某班學生考試成績絕大多數在50~80分之間,只有某個學生的成績為35分,那么第一組可設為“60分以下”;若有另一個學生的成績為95分,而“80~90分”一組中沒有數據,則取最后一組為“80分以上”。當然,第一組和最后一組可以單獨設為開口組,也可以同時設為開口組,視數據的具體情況而定。另外,確定組限時,要求第一組的下限略小于或等于最小變量值,最后一組的上限略大于最大變量值。136byJinLin@ZNUFE利用Excel工作表編制數值型數據的頻數分布表時,要先對原始數據進行排序,作為A列的數據區域,再取各組的上限放在B列組成接收區域。運用在“工具”下拉菜單中的“數據分析”,選擇“直方圖”,單擊“確定”項;將數據區域和接收區域鍵入;在“輸出選項”中選擇“輸出區域”并鍵入結果輸出的區域;選擇“圖表輸出”;點擊“確定”選項。由于Excel輸出結果的接收欄不是組距分組的形式,故直接對結果進行修改,用80~120代替120,用120~160代替160,……將“其他”改為“合計”,合計欄的值改為80,用“人均通信支出額”代替“接收”,用“頻數”代替“頻率”,并計算出頻率和百分比,得到表:也可以用數組函數Frequency.公式必須以數組公式的形式輸入。請選中從公式單元格開始的單元格區域A13:A16。按F2,再按Ctrl+Shift+Enter。137byJinLin@ZNUFE138byJinLin@ZNUFE在頻數分布的基礎上,將各組頻數依次累計,即形成累計頻數分布。采用由小到大累計頻數分布是將各組的頻數,由變量值小的組向變量值大的組依次累計,它用于說明某一組上限以下各組的頻數之和,除以數據個數即可表明某一組上限以下各組的單位總和占總體單位總和的比重,反映了某一組上限以下的總體單位分布狀況。由大到小累計頻數分布是將各組的頻數,由變量值大的組向變量值小的組依次累計,它用于說明某一組下限以上各組的累計頻數之和,除以數據個數即可表明某一組下限以上各組的單位總和占總體單位總和的比重,反映了某一組下限以上的總體單位分布狀況。如由上表可知,80戶家庭人均通信支出額在280元以下的戶數占86.25%,80戶家庭人均通信支出額在200元以上的家庭占55%。139byJinLin@ZNUFEExcel分組數據—直方圖和折線圖用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布在直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖直方圖下的總面積等于1byJinLin@ZNUFE140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖我一眼就看出來了,銷售量在170~180之間的天數最多!190200180160170頻數(天)25201510530220230240byJinLin@ZNUFE條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續排列,條形圖則是分開排列條形圖主要用于展示分類數據,直方圖則主要用于展示數值型數據byJinLin@ZNUFE折線圖也稱頻數多邊形圖是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的byJinLin@ZNUFE折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(天)25201510530byJinLin@ZNUFESTATISTICA未分組數據—莖葉圖和箱線圖用于顯示未分組的原始數據的分布由“莖”和“葉”兩部分構成,其圖形是由數字組成的以該組數據的高位數值作樹莖,低位數字作樹葉樹葉上只保留一位數字對于n(20n300)個數據,莖葉圖最大行數不超過

L=[10×lgn]莖葉圖類似于橫置的直方圖,但又有區別直方圖可觀察一組數據的分布狀況,但沒有給出具體的數值莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保留了原始數據的信息byJinLin@ZNUFEbyJinLin@ZNUFEbyJinLin@ZNUFE用于顯示未分組的原始數據的分布箱線圖由一組數據的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數據的5個特征值,即最大值、最小值、中位數Me和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分(位)數畫出箱子,再將兩個極值點與箱子相連接byJinLin@ZNUFE中位數4681012QUQLX最大值X最小值簡單箱線圖byJinLin@ZNUFE最小值141最大值237中位數182下四分位數170.25上四分位數197140150160170180190200210220230240某電腦公司銷售量數據的箱線圖byJinLin@ZNUFE

對稱分布QL中位數

QU左偏分布QL中位數

QU右偏分布QL

中位數

QU不同分布的箱線圖byJinLin@ZNUFE【例】

從某大學經濟管理專業二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征byJinLin@ZNUFE8門課程考試成績的箱線圖byJinLin@ZNUFE11名學生8門課程考試成績的箱線圖min-max25%-75%medianvalue455565758595105學生1學生2學生3學生4學生5學生6學生7學生8學生9學生10學生11byJinLin@ZNUFE時間序列數據—線圖Excel繪制線圖時應注意以下幾點:時間一般繪在橫軸,指標數據繪在縱軸圖形長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數據下端應從“0”開始,以便于比較。數據與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷byJinLin@ZNUFE【例】已知1991~2000年我國城鄉居民家庭的人均收入數據如表。試繪制線圖¥

byJinLin@ZNUFEbyJinLin@ZNUFE多變量數據—散點圖、氣泡圖、雷達圖Excel散點圖在Excel的“圖表向導”中XY散點圖是反映兩個變量相互關系的圖形,它以前一列變量X作為橫軸,以后一列變量Y作為縱軸。162byJinLin@ZNUFE氣泡圖(bubblechart)是反映三個變量之間的關系的圖形。與二維散點圖不同,它用兩個自變量作為橫軸和縱軸,而因變量的大小用圖中的氣泡大小來表示。163byJinLin@ZNUFE顯示多個變量的圖示方法在顯示或對比各變量的數值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論