




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第一章緒論
第一節.管理現實中的統計應用
第二節.管理統計學的含義、特點和內容
管理現實中的統計應用
管理統計學在人口管理中的應用
管理統計學在市場營銷中的應用
管理統計學在企業管理中的應用
管理統計學在投資分析和風險決策中的應用
1.投資分析
2.風險管理
3.期貨交易
管理統計學的含義、特點和內容
管理統計學的含義:它是一門以經濟與管理理論為基礎,采用描述和推斷的方法來對社會經濟和管理現象中研究對象的數量特征、數量關系、發展變化趨勢及規律進行研究,最終解決管理和經濟問題的學科。它是一門應用性的方法論科學,以數理統計學的理論和方法為基礎,不斷吸收信息論、控制論、系統論和決策論等方面的研究成果,使統計職能從反映和監督拓展到推斷、預測和決策的學科。
管理統計學的特點:描述統計:通過大量數據資料的搜集、整理和分析,描述出總體數據的分布特征,進而達到對總體內在的數量規律性的認識。推斷統計:根據實際工作中所搜集到的統計資料絕大部分都是樣本資料這一特點,利用這些樣本資料所提供的信息,進一步對總體的數量規律性做出科學的推論。管理統計學:將描述統計和推斷統計的基本方法有機地結合在一起,形成在社會經濟管理中常用的統計方法,并用以解決實際問題的一門學問。
管理統計學的內容:以社會經濟現象靜態信息為依據,應用統計分組和變量數列,采取絕對數、相對數、平均數等具有離散趨勢的指標,對現象總體的頻數分布、極差、絕對總量、相對程度以及集中離散趨勢等進行描述。根據社會經濟現象動態統計信息,采用動態比較、動態平均、長期趨勢、季節波動等,對現象總體的發展變化情況、變動趨勢及變化成分進行統計描述和推斷。對社會經濟現象中大量隨機變量間的交互統計信息,采用相關回歸分析,刻畫現象變量間的相關程度和數學表達式,建立回歸方程進行統計預測;或采用投入產出分析,揭示部門間的數量聯系,綜合反映其運行狀態。根據實際現象變量的概率分布、大數定律和中心極限定律,運用抽樣推斷原理,按照一定的方式用樣本統計量去推算統計總體參數,并進行假設檢驗、方差分析和非參數估計等。根據現象過去和現在的統計信息,對未來數量特征,運用平均數模型、長期趨勢模型、季節波動模型、回歸模型及時間序列分析等,借助計算機進行統計預測,為統計決策和控制提供數值依據。根據社會經濟數量的目標函數、約束條件、自然狀態及其概率,建立數學模型,運用優化思想、風險決策技術及貝葉斯決策原理對企業實施有效決策,為合理的經濟管理核算服務。結束第二章統計數據的搜集與整理第一節.數據的計量與類型第二節.統計數據的搜集與可靠性分析
第三節.抽樣調查中的基本概念
第四節.抽樣方法介紹
學習目的理解數據類型掌握抽樣中用到的基本概念的含義掌握幾種抽樣方法的抽樣過程、要求、特點案例與背景某化妝品公司對其銷售情況做統計,以制定下一季度的實施計劃。銷售情況包括銷售代表和門市的月平均銷售量及他們所占比率。500名銷售代表和20家門市構成此次統計的總體,公司參照門市的營業額來完成調查。假設,我們無法獲取全部銷售代表的信息,我們就考慮選取50名銷售代表組成一個樣本,顯然,這樣做比總體統計要節約時間和成本。本章將學習數據的計量與類型、數據的搜集、抽樣方法和抽樣分布的幾種類型,并簡單介紹其應用范圍。第一節數據的計量與類型1.1 數據的計量尺度
變量:對象(或單位)的特征。例如,我們想研究對象的性別、身高或他所持有的定期大額存單數量。一般來說,變量分為定性變量和定量變量。
定性變量類型離散定量連續定性變量與定量變量定性變量:定性變量不一定是數值型變量,但卻可以歸到數值型變量當中。定性變量的數值沒有數學意義。定性變量得到的觀察值常常稱為“類型數據”。一般而言,定性變量包括計算有多少對象或者描述有多少對象(用百分比表示)落在某一特定的區域。定量變量:定量變量表現為數值型變量。這些數值有數學意義。定量變量分為兩類:即離散變量和連續變量。離散變量與連續變量離散變量:如果得到的一組可能結果是有限或可數的,那么我們稱這種定量變量為離散變量。也就是說,離散變量表現為某些數值,各個可能的數值之間存在間隙。連續變量:如果得到的一組可能結果是區間集合內的任意數值,那么我們稱這種定量變量為連續變量。也就是說,數值可以是區間內的任意點?!纠?-1】判斷下列變量的類型郵局信件的重量小轎車的牌子鐳射唱片總的播放時間鐳射唱片所含的歌曲數量中午的溫度某個季節的降雨量一個人的宗教信仰繩子長度某個班不同學生的生日日期上個季節某大學患感冒的大學生人數連續定量變量定性變量連續定量變量離散定量變量連續定量變量連續定量變量定性變量連續定量變量離散定量變量離散定量變量1.2統計數據的類型定性變量可以采用“名義尺度”或“順序尺度”來測量名義尺度:數值屬于不同的類型。這些數值沒有任何數學意義或者排列順序沒有任何意義。也就是說,數值是任意性的。例如,性別、宗教和種族就屬于這一類。順序尺度:當我們把數值歸為不同類型時,排列順序(升序或降序)有意義。也就是說,這些數值暗示了類型的級別、偏好和順序。注意,由于測量值沒有量綱,因此數值之間的差值并不代表兩個對象之間的差距。例如,對餐館提供的服務進行評級、對軟飲料偏好程度進行評定就屬于這一類。
定量變量可以采用“比例尺度”或“間隔尺度”來測量間隔尺度:由于有測量單位,因此我們可以用數值之間的差值來描述兩個對象之間的差距。但是,數值之間的比例沒有任何意義,“零”這個數值沒有內在的含義。可以作加法、減法計算,但不可以作乘法計算。例如,溫度就屬于這一類。我們不能說10攝氏度是5攝氏度的2倍。比例尺度:由于也有測量單位,因此我們可以用數值之間的差值來描述兩個對象之間的差距。數值之間的比例有意義,而且“零”這個數值有內在的含義不僅可以作加減運算,還可以作乘除運算。例如,身高、重量和花費的時間就屬于這一類。【例2-2】美國消費者是否習慣通過互聯網利用信用卡進行購物?假設一家著名的機構表示一旦突破了80%這個數字關卡,人們在頭腦中就會牢固樹立起通過互聯網利用信用卡進行購物的觀念。Gallop公司近期所做的一項民意調查表明:在被調查的302位購物者當中,有267人是通過互聯網利用信用卡進行支付的。根據Gallop公司的調查結果,我們很想證實是否有足夠的證據讓我們得出以下結論:80%以上的消費者愿意通過互聯網利用信用卡進行購物。
1.我們關心什么變量?變量的性質是什么?
2.測量指標是什么?【例2-3】在下列事項中采用什么測量指標
能夠最好地描述相關信息?A.一家移動電話公司最近宣布它將從東南亞運營機構裁減80名職員。B.天氣預報說,昨天下午1點53分觀察到的溫度值突破了新加坡的歷史記錄。C.一家大公司的人力資源管理部門想要調查員工是否對在職培訓感到滿意。D.一家市場研究機構想要調查行人是否注意到新加坡的大片島嶼安裝了新的交通信號燈系統(LED)。
A.比例尺度
B.間隔尺度
C.順序尺度
D.名義尺度
【例2-4】考察以下變量,這些變量代表了新加坡390所學校的情況:該地區的學生數量、學校名稱、每名學生花費的金額、教師的平均工資水平、學生的智商。
1.哪些變量屬于定性變量?哪些變量屬于定量變量?
2.確定每種變量的測量指標。
(a) 定性變量
學校名稱定量變量
該地區的學生數量每名學生花費的金額教師的平均工資水平學生的智商
(b)該地區的學生數量
比例尺度 學校名稱
名義尺度 每名學生花費的金額
比例尺度 教師的平均工資水平
比例尺度 學生的智商
間隔尺度1.3絕對數與相對數絕對數:
反映客觀現象總體在一定時間、地點條件下的總規模、總水平的綜合指標,表現為事物的絕對水平的描述。如:一定總體范圍內的糧食總產量、農業總產值、國營企業數等。相對數:反映兩個有聯系的指標的比值,它可以從數量上反映兩個相互聯系的現象之間的對比關系和聯系程度。相對數通常用百分比、千分比或萬分比等來表示。如:每千只燈泡的次品率、每百名疾病患者的死亡率等。計算相對數的基本公式為:相對數的種類很多,根據其表現形式可分為兩類:一類是有名數,即凡是由兩個性質不同而又有聯系的絕對數或平均數指標對比計算所得的相對數,一般都是有名數,而且多用復合計量單位,如人口密度、人均占有土地和人均國內生產總值等。另一類是無名數,無名數可以根據不同的情況分別采用倍數、成數、系數、百分數、千分數等來表示,如:人口出生率、死亡率等。相對數根據相互對比的指標性質和所能發揮的作用不同,又可分為動態相對數、結構相對數、比較相對數、強度相對數、計劃完成程度相對數等五種。【例2-5】考察某時期兩個部隊患病的情況:A部隊有534人,其中患病人數為17人;B部隊有313人,其中患病人數為10人。我們能否得到A部隊的患病率較高的結論。從絕對數的概念來看,A部隊患病人數比B部隊高7人。從相對數來看,
A部隊的患病率為:
B部隊的患病率為:因此,兩部隊的患病率是一樣的。第二節統計數據的搜集與可靠性分析2.1總體與樣本總體和個體對我們研究的對象來說,研究對象的全部元素組成的集合,稱為總體組成總體的每一個元素成為個體,個體又稱為總體單位。作為統計的總體和個體,必須具備下面4個條件:①客觀性②大量性③同質性④差異性統計總體按其包含的單位數分,可分成:有限總體和無限總體兩類。統計總體按其個體的時空性分,可分成:空間總體和時間總體兩類??傮w和個體的概念不是固定不變的,隨著研究目的的不同,它們二者是會轉換的。
樣本與抽樣樣本:從總體中隨機抽出一部分個體進行觀察所組成的稱為樣本。簡單隨機樣本:若被抽出的每一個個體之間相互獨立,與總體有相同的分布,每個個體被抽取的幾率是一樣的(隨機性),則這樣的樣本叫做簡單隨機樣本。抽樣:而從總體挑選一部分個體的過程叫做抽樣。
變異、變量和變量值變異:某一標志具體表現在各總體單位的差別或差異稱之為變異。包括品質標志的差異和數量標志的差異。變量:即可變的數量標志。變量按變量變動是否連續,分為連續型變量與離散型變量。連續型變量是連續不斷的,相鄰兩個變量值之間可作無限分割;離散型變量值不是連續不斷的,相鄰兩個變量值之間不能無限分割。變量值:亦稱標志值,是變量的具體數值表現。
參數和統計量參數研究者想要了解的總體的某種特征值所關心的參數主要有總體均值(
)、標準差(
)、總體比例(
)等總體參數通常用希臘字母表示統計量根據樣本數據計算出來的一個量所關心的樣本統計量有樣本均值(
x)、樣本標準差(s)、樣本比例(p)等樣本統計量通常用小寫英文字母來表示2.2統計調查方式統計調查是取得社會經濟數據的主要途徑,也是直接獲得第一手統計數據的重要手段。主要的統計調查方式有:普查、抽樣調查和統計報表三種。另外,除了上述三種調查方式外,實際工作中還常用到重點調查和典型調查,它們屬于非全面調查。2.3數據的搜集方法
統計數據的直接來源
無論采取何種方式進行調查,在取到需要的統計數據時,都有一些具體的數據搜集方法。調查方法可分成:詢問法、觀察法和實驗法三種。除了以上三種主要的調查方法外,還有計算機輔助調查、座談會、個別深度調查等。統計數據的間接來源
第二手數據主要來源是公開出版或報道的數據,當然有些是未公開的。在我國,公開出版或報道的社會經濟統計數據主要來源是國家和地方的統計部門以及各種學報。除了上面獲得統計數據的方式外,還可以從各種報刊、雜志、圖書、電視傳播中獲得,隨著計算機網絡技術的發展,我們也可以從因特網中獲得統計數據。2.4調查方案的設計
1.確定調查目的2.確定調查對象和調查單位3.設計調查項目和調查表4.確定調查時間5.調查的組織實施2.5資料的質量分析和可靠性分析
統計數據的誤差在現實生活中,誤差的產生是不可避免的,統計數據的誤差通常是統計數據與客觀世界間的差距,誤差的來源主要有主觀性誤差和客觀性誤差兩類。主觀性誤差是由于調查者或被調查者在調查的過程中主觀人為因素造成的。客觀性誤差主要是統計推斷和預測所產生的隨機誤差。隨機誤差:由于樣本的隨機性而產生的樣本對總體代表性的誤差叫做抽樣誤差,也稱為隨機誤差。統計數據的質量分析
精度:保證抽樣誤差或隨機誤差盡量小準確性:人為因素產生的誤差或偏差足夠小。關聯性:滿足相關人員決策、管理和研究的需要。及時性:在最短時間內取得并公開數據。一致性:保持時間序列可比性。經濟性:在滿足上面指標前提下,以最小費用式取得數據。統計數據的可靠性分析
首先要明確統計調查的目的,我們選取某個事件作為調查對象必須符合調查目的;其次,在取得統計數據的過程中,不可避免地要經歷抽樣的過程,統計數據的可靠性主要依賴于抽樣的過程是否科學。在抽樣的過程中應注意以下4個方面:隨機性:樣本抽取的過程一定是隨機的。換句話說,每個個體被抽到的幾率是一樣的,不能因為人為因素破壞這種隨機性。一致性:樣本結構和總體結構應該保持一致。獨立性:樣本中每個個體之間應該是獨立的。足量性:樣本容量一定要足量。第三節抽樣調查中的基本概念3.1概率抽樣與非概率抽樣概率抽樣也稱隨機抽樣。概率抽樣:就是使總體中的每一個單位都有一個已知的、不為零的概率進入樣本的抽樣方法。非概率抽樣:是指抽樣時不遵循隨機原則,而是按照研究人員的主觀經驗或其它條件來抽取樣本的一種抽樣方法,也就是說在抽樣時,總體單元的入樣概率事先未知,入樣與否與研究人員的經驗和主觀意志有很大關系。兩者的不同:是否遵循隨機原則非概率抽樣一般不能用數理統計方法進行推斷。3.2抽樣誤差和處理
抽樣誤差:由于個體存在差異,導致每個樣本的樣本統計量的值與總體參數之間存在的差異。影響抽樣誤差的因素:總體各單位標志值的差異程度;樣本的單位數;抽樣的方法;抽樣調查的組織形式。盡管抽樣誤差是無法避免的,但它卻是可以控制的。選擇適當的抽樣方法或者抽樣設計是控制這種誤差的一個重要方法。第四節抽樣方法介紹樣本不能準確代表總體,在研究設計中會出現偏差:偏差:如果抽樣方法得到的結果與總體的真實情況存在系統性差距,那么我們說這種抽樣方法存在偏差選擇性偏差:系統性趨勢排除或包括某一類單位無反應偏差:樣本所選擇的單位不產生反應,而且與應答者相比,它們具有非常不同的特性反應偏差:調查者的提問時間和提問方式會對被調查單位做出的反應產生影響【例2-6】:電視節目就槍支控制問題進行了一項民意調查。電視觀眾被邀請就這一問題發表自己的意見。你認為民意調查結果值得信賴嗎?電視節目調查一般會產生偏差。因為這種調查是依據自愿抽樣方法進行的,即只有那些觀看電視節目并對這一問題有強烈意見的人才有可能接受調查。因此,調查結果存在偏差,不能真正加以信賴?!纠?-7】:電話調查:如果隨機從電話本上選取電話及其號碼進行某項調查,請問是否會產生偏差?由于只有那些將電話及其號碼印在電話本上的人才有機會被選入到樣本中,因此會出現選擇性偏差?!纠?-8】:郵件調查在大部分郵件調查中,較低和較高的社會階層一般不愿意對調查做出回答,這表面調查結果過于代表中層階級的觀點。這時會產生無反應偏差?!纠?-9】:一名心理學家想要研究夫婦之間的分居問題。此時你會遇到這樣一個問題,“心理學家發現分居會削弱夫婦之間的感情,正如一句俗語所說,眼不見,心不想。你能夠想象為什么會那樣嗎?”受訪者對結果并不感到奇怪。這名心理學家在不同的時候對另一組受訪者又進行了同樣的調查,“心理學家發現分居會增強夫婦之間的感情。正如一句俗語所說,分離使愛心更濃。你能夠想象為什么會那樣嗎?”受訪者對結果并不感到奇怪。由于敘述中選用了不同的詞匯,因此調查結果出現了反應偏差。4.1隨機抽樣簡單隨機抽樣(純隨機抽樣)對總體單位不進行任何分組排列,僅按隨機原則直接從總體中抽取樣本,以使總體中的每一個單位均有同等的被抽取的機會。一種基本的等概率抽樣方法,其他概率抽樣都可以看成是由它派生出來的。具體做法:直接抽選法抽簽法隨機數碼表法主要用于以下情況:對調查對象的情況很少了解;總體單位的排列沒有秩序;抽到的單位比較分散時也不影響調查工作。4.2分層抽樣(類型抽樣)在分層隨機抽樣中,首先將總體分成若干層,然后從每一層中抽取一個簡單隨機樣本。每一層抽取的觀察值數量不僅能夠代表樣本的百分比,而且能夠代表總體的百分比。同一層的觀察值應當有相同的特征。不同層的觀察值會表現出不同的特征。具體步驟如下:第一,按照某一種或幾種特征對總體進行分層。第二,確定在各層中抽取樣本單位的數量??刹扇〉缺壤筒坏缺壤槿煞N不同的方法。
各層(組)的抽樣單位數的確定類型比例抽樣方法不考慮各組標志差異程度,而是根據統一的比例來確定各組抽取的單位數。類型適宜抽樣方法根據抽樣誤差大小與標志差異程度、抽樣單位數等的關系來確定。差異大的組多抽,差異小的組少抽。分層抽樣抽樣的主要優點有:提高從樣本推斷總體的精確性。分層抽樣特別適用于既要對總體參數進行推斷,也要對各子總體(層)的參數進行推斷的情形,例如一項全國性抽樣調查,若以省為層,那么調查以后即可進行全國性的統計,也可獲得各省的統計數據。分層抽樣實施起來靈活方便,而且便于組織。由于抽樣是在各層獨立進行的,因此它允許根據不同層的情況采用不同的抽樣方法。分層抽樣要求:盡量使層(組)的分布與總體中個體的分布相似即要求層內(組內)方差盡量小,而層間(組間)方差盡量大。分層抽樣的主要局限性:調查者必須對總體情況有較多的了解,否則無法進行恰當的分層。4.3等距抽樣等距抽樣,又稱系統抽樣或機械抽樣。是對研究的總體按一定的順序排列,每隔一定的間隔抽取一個或若干個單位,并把這些抽取的單位組成樣本進行觀察的一種抽樣方法。kiki+ki+2ki+(n-1)kik等距抽樣示意圖雖然等距抽樣在概念方面與簡單隨機抽樣很相似,但這種方法在實踐中更加容易實施。這種方法是以相等間隔從總體中抽取觀察值。等距抽樣的主要優點:易于實施,工作量少樣本在總體中的分布比較均勻,故而抽樣誤差小于或至多等于簡單隨機抽樣,即較其精確。等距抽樣的弱點:容易造成系統性誤差等距抽樣是以總體單位的無規律排列為前提的,其存在的一個潛在問題是周期性,當總體呈現周期性變化時會出現這種現象,而且周期長度與我們采用系統抽樣觀察到的結果一樣。雖然周期性并不常見,但在進行等距抽樣時應當考慮到這個問題。
等距抽樣的分類按排隊所依據的標志不同,分為:無關標志排隊:排隊的標志與調查的內容無關。有關標志排隊:排隊的標志與調查內容有關。按樣本單位抽選的方法不同,可分為:隨機起點等距抽樣無關標志排隊可用。有關標志排隊會產生系統性誤差。
半距起點等距抽樣有關標志排隊和無關標志排隊都可用隨機性不明顯;只能抽取一個樣本,不能進行樣本輪換,抽樣的利用率低。
對稱等距抽樣避免了半距抽樣的局限性,優點更加明顯。4.4整群抽樣整群抽樣又稱聚類抽樣把總體分成若干個組(或群)。每一組就好像是總體的縮影。然后從這些群中抽取若干群作為一個簡單隨機樣本,或者對被抽中群的所有個體進行全面調查。主要優點:易于取得抽樣框,便于組織,可以節省人力、物力和財力。最大缺點:樣本分布不均勻,樣本的代表性差。它與其他抽樣方法相比,在樣本容量相同時,其抽樣誤差較大。要求:要使整群抽樣的誤差小成為可能的話,在劃分群時,應使群內方差盡可能大,而使群間方差盡可能小。案例分析:1936年美國總統大選,由民主黨人羅斯福對陣共和黨人蘭登。美國一著名雜志社作了一項民意調查,該雜志根據電話號碼簿、俱樂部名冊、駕駛證等隨機調查了大量的民眾。據其結果,該雜志預言蘭登將以壓倒性優勢獲勝,但大選結果卻截然相反。試從抽樣的角度詮釋預測失敗的原因。究其原因,在于該雜志是從電話號碼簿、俱樂部名冊、駕駛證等去選擇被調查對象的,這類人多屬于富有階層,傾向共和黨者居多,這違反了隨機抽樣的原則,屬于便利抽樣。因此,這類教訓應在抽樣調查中汲取。結束第三章統計數據的概括性描述第三章統計數據的概括性描述第一節統計數據的整理與展示第二節數據集位置的測度第三節數據集離散程度的測度第四節數據集的峰度與偏度學習目標了解數據預處理的內容和目的掌握分配數列的整理與顯示方法掌握數據集的位置測度的變量與方法掌握數據集的離散程度測度的變量與方法掌握數據集的分布形態測度的變量與方法用SPSS作頻數分布表和形圖案例與背景統計數據首先需要經過預處理和整理,以便人們對數據分布的類型和特點有了一個大概的了解。但這種了解并不能幫助我們準確地描述出統計數據的分布,還需要更深入的分析,找到能反映數據分布特征的各個代表值。對統計數據分布的特征和規律,可以從本章所介紹的三個方面進行測度和描述:一是數據集位置的測度,反映各數據向其中心值靠攏或聚集的程度;二是數據集離散程度,反映各數據遠離其中心值的趨勢;三是數據集的峰度與偏度,反映數據分布的形狀。這三個方面從不同側面反映了數據分布特征。本章將重點介紹這些代表值的計算方法、特點及其應用。第一節統計數據的整理與展示3.1.1數據的預處理3.1.2頻數分布表的編制與圖示3.1.1數據的預處理數據的審核檢查數據中的錯誤數據的篩選找出符合條件的數據數據排序升序和降序尋找數據的基本特征數據審核—原始數據
(rawdata)
審核的內容完整性審核檢查應調查的單位或個體是否有遺漏所有的調查項目或指標是否填寫齊全準確性審核檢查數據是否真實反映客觀實際情況,內容是否符合實際檢查數據是否有錯誤,計算是否正確等數據的審核—原始數據
(rawdata)
審核數據準確性的方法邏輯檢查從定性角度,審核數據是否符合邏輯,內容是否合理,各項目或數字之間有無相互矛盾的現象主要用于對分類和順序據的審核計算檢查檢查調查表中的各項數據在計算結果和計算方法上有無錯誤主要用于對數值型數據的審核數據的審核—二手數據
(secondhanddata)適用性審核弄清楚數據的來源、數據的口徑以及有關的背景材料確定數據是否符合自己分析研究的需要時效性審核盡可能使用最新的數據確認是否必要做進一步的加工整理數據篩選
(datafilter)當數據中的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,需要對數據進行篩選數據篩選的內容包括將某些不符合要求的數據或有明顯錯誤的數據予以剔除將符合某種特定條件的數據篩選出來,而不符合特定條件的數據予以剔數據篩選
(datafilter)用SPSS進行數據篩選
8名學生的考試成績數據
數據排序
(datarank)按一定順序將數據排列,以發現一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數據檢查糾錯,以及為重新歸類或分組等提供依據在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成數據排序
(方法)分類數據的排序字母型數據,排序有升序降序之分,但習慣上用升序漢字型數據,可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分數值型數據的排序遞增排序:設一組數據為x1,x2,…,xn,遞增排序后可表示為:x(1)<x(2)<…<x(n)遞減排序:可表示為:x(1)>x(2)>…>x(n)3.1.2頻數分布表的編制與圖示頻數與頻數分布統計分組品質數列的整理和顯示變量數列的整理和顯示頻數分布的類型1.頻數與頻數分布頻數分布數列的概念在統計分組的基礎上,將總體的所有單位按組歸類整理,并按一定順序排列,形成總體中各個單位在各組簡的分布,又稱次數分配或分布數列。頻數(frequency)
:又叫次數,落在各類別中的數據(單位)個數,記作Fi。
頻率(ratio)
:又叫比率,各組次數(頻數)與總次數(頻數)之比。頻率分布的性質:=££???===110111NiNiiiNiiiFFFF分配數列的種類品質分配數列(屬性分布數列):按品質標志分組形成的分配數列。變量分配數列(變量分布數列):按數量標志分組形成的分配數列。單項數列:總體按單項式分組而形成的變量數列,每個變量值是一個組,順序排列。組距數列:總體按組距式分組而形成的變量數列,每個組是由若干個變量值形成的區間表示。分配數列品質數列變量數列單項數列組距數列2.統計分組統計分組—概念:是根據統計研究的目的,選擇某一主要標志,將總體單位劃分為若干類型或組別,使組內具有同質性,組間具有差異性。統計分組—作用劃分現象的類型揭示現象內部結構分析現象之間的依存關系統計分組—分組標志的選擇統計分組的關鍵問題:如何選擇分組標志和確定各組的界限。根據統計研究的目的來選擇在滿足研究目的的前提下,應選擇本質的、主要的,而不是非本質的、次要的標志??紤]具體的歷史和經濟條件。簡單分組、復合分組和分組體系根據采用的分組標志的多少,可以分為:簡單分組復合分組簡單分組又稱單一分組,是對被研究現象總體只按一個標志進行的分組。特點:只能反映現象在某一標志特征方面的差異情況。不能反映現象在其他標志特征方面的差異,說明問題比較簡單明了。簡單分組按性別分組男女按年齡分組0~6歲組7~17歲組18~59歲組60歲以上組復合分組對同一總體選擇兩個或兩個以上標志層疊起來進行的分組。特點:可以從幾個不同角度了解總體內部的差別和關系,比簡單分組能更全面、更深入地研究問題;分組的組數隨著分組標志的增加而成倍地增加。因而在采用復合分組時,選擇分組標志的數量要適量,并且要考慮倒只有在總體包括的單位數較多的情況下,才宜于采用復合分組。理科學生組高等學校學生總體男學生組女學生組男學生組女學生組本科學生組??茖W生組男學生組女學生組男學生組女學生組文科學生組本科學生組??茖W生組復合分組分組體系為了從不同側面反映總體的特征,運用幾個標志對總體進行分組,形成的一個完整的體系。分組體系有兩種不同的形式:平行分組體系:同一個總體的幾個簡單分組按某一規定排列起來就構成一個平行分組體系。復合分組體系:由復合分組形成的分組系列。3.品質分布數列的整理與顯示分類數據的整理順序數據的整理品質分布數列的整理列出各類別計算各類別的頻數制作頻數分布表用圖形顯示數據分類頻數比例百分比比率ABCDE分類數據整理—頻數分布表
(例題分析)【例3.1】一家市場調查公司為研究不同品牌飲料的市場占有率,對隨機抽取的一家超市進行了調查。調查員在某天對50名顧客購買飲料的品牌進行了記錄,如果一個顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。右邊就是記錄的原始數據用SPSS制作頻數分布表分類數據的圖示—條形圖
(barChart)用寬度相同的條形的高度或長短來表示各類別數據的圖形有單式條形圖、復式條形圖等形式主要用于反映分類數據的頻數分布繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖分類數據的圖示—條形圖
(例題分析)分類數據的圖示—餅圖
(pieChart)也稱圓形圖,是用圓形及園內扇形的面積來表示數值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結構性問題十分有用繪制圓形圖時,總體中各部分所占的百分比用園內的各個扇形面積表示,這些扇形的中心角度,是按各部分數據百分比占3600的相應比例確定的分類數據的圖示—餅圖
(例題分析)順序數據的整理累積頻數(cumulativefrequencies):各類別頻數的逐級累加累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級累加順序數據的頻數分布表
(例題分析)【例3.2】在一項城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)累計戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510241322252703008.044.075.090.0100.0合計300100.0——順序數據的頻數分布表
(例題分析)乙城市家庭對住房狀況評價的頻數分布回答類別乙城市戶數(戶)百分比(%)累計戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合計300100.0——順序數據的圖示—累計頻數分布圖
(例題分析)甲城市家庭對住房狀況評價的累積頻數分布環形圖
(annularchart)環形圖中間有一個“空洞”,總體中的每一部分數據用環中的一段表示環形圖與圓形圖類似,但又有區別圓形圖只能顯示一個總體各部分所占的比例環形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環環形圖可用于結構比較研究環形圖主要用于展示分類和順序數據環形圖
(例題分析)8%36%31%15%7%33%26%21%13%10%
非常不滿意
不滿意
一般
滿意
非常滿意
甲乙兩城市家庭對住房狀況的評價4.變量數列的整理與顯示
數據分組累計頻數分布數值型數據的圖示數據分組分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組
(要點)將一個變量值作為一組適合于離散變量適合于變量值較少的情況組距分組
(要點)將變量值的一個區間作為一組適合于連續變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組等距分組
(步驟)確定組數:組數的確定應以能夠顯示數據的分布特征和規律為目的。在實際分組時,可以按Sturges
提出的經驗公式來確定組數K確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即組距=(最大值-最小值)÷組數統計出各組的頻數并整理成頻數分布表確定全距(極差):全部變量的最大之與最小值的距離頻數分布表的編制
(例題分析)【例3.3】某電腦公司2002年前四個月各天的銷售量數據(單位:臺)。試對數據進行分組。
頻數分布表的編制
(步驟)確定組數:根據Sturges提出的經驗公式得組數K為:確定各組的組距:組距=(237-141)÷10=9.6
10用SPSS制作頻數分布表
組距分組與不等距分組
(在表現頻數分布上的差異)等距分組各組頻數的分布不受組距大小的影響可直接根據絕對頻數來觀察頻數分布的特征不等距分組各組頻數的分布受組距大小不同的影響各組絕對頻數的多少不能反映頻數分布的實際狀況需要用頻數密度反映頻數分布的實際狀況異距分組
(幾個概念)標準組距:數列中能被各組組距整除的最大組距。常用數列中的最小組距作為標準組距。異距分組
(例題分析)某廠工人年齡分布情況工人按年齡分組組距人數(人)標準組距人數次數密度15~2020~2525~3030~3535~4545~5055551051728407065101728407032.5103.45.68146.52合計-230——異距分組
(例題分析)異距分組
(例題分析)組限和組中值組限(classlimit)
:各組的上限界限值組下限(lowlimit)
:一個組的最小值組上限(upperlimit)
:一個組的最大值閉口組:上限和下限都齊全的組開口組:上限或下限有一個沒有的組組限的確定組限確定有一個基本原則:即按這樣的組限分組后,標志值在各組的變動能反映事物的質的變化。常用的組限表示方法:按連續變量分組,由于相鄰兩組的上限和下限常時同一數值,每組的界限會重疊,為避免計算各組次數時出現混亂,一般的原則是“上組限不在內,或下組限不在內”。按離散變量分組,則相鄰的上限和現象通常是以兩個確定的不同整數值來表示,故相鄰兩組的上下限可以不重合。等距分組表
(上下組限重疊)等距分組表
(上下組限間斷)等距分組表
(使用開口組)組中值(classmidpoint)
組中值(classmidpoint)
:下限與上限之間的中點值。下限值+上限值2組中值=累計頻數分布累計頻數分布在頻數分布的基礎上將各組頻數逐一累計,稱為頻數分布累計。向上累計:從變量值最低組開始向變量值高的組累計,表明小與該組上限的頻數(頻率)一共有多少;向下累計:從變量值最高組開始向變量值低的組累計,表明大與該組下限的頻數(頻率)一共有多少。特點:同一數值的向上累計和向下累計次數之和等于總體總次數。累計頻數分布圖:以變量值為橫坐標,累計頻數和頻率為縱坐標。累計頻數分布
(例題分析)141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172175180187194200211234156165172176181188195201211234158165172176182188195202213237某電腦公司2002年前4個月的銷售量累計頻數分布
(例題分析)按銷售量分組(臺)頻數(天)頻率(%)向上累積頻率(%)向下累積頻率(%)150以下43.333.33100.00150~16097.5010.8396.67160~1701613.3324.1789.17170~1802722.5046.6775.83180~1902016.6763.3355.33190~2001714.1777.5036.67200~210108.3385.8322.50210~22086.6792.5014.17220~23043.3395.837.50230以上54.17100.004.17合計120100100.00100.00累計頻數分布
(例題分析)變量分布數列的圖示
分組數據—直方圖和折線圖分組數據—直方圖
(histogram)用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布在直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖直方圖下的總面積等于1分組數據的圖示
(直方圖的繪制)140150210直方圖下的面積之和等于1某電腦公司銷售量分布的直方圖190200180160170頻數(天)25201510530220230240分組數據—直方圖
(直方圖與條形圖的區別)條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續排列,條形圖則是分開排列條形圖主要用于展示分類數據,直方圖則主要用于展示數值型數據分組數據—折線圖
(frequencypolygon)折線圖也稱頻數多邊形圖是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的分組數據的圖示
(折線圖的繪制)折線圖與直方圖下的面積相等!140150210某電腦公司銷售量分布的折線圖190200180160170220230240頻數(天)25201510530數值型數據的圖示未分組數據—莖葉圖和箱線圖未分組數據—莖葉圖
(stem-and-leafdisplay)用于顯示未分組的原始數據的分布由“莖”和“葉”兩部分構成,其圖形是由數字組成的以該組數據的高位數值作樹莖,低位數字作樹葉樹葉上只保留一位數字對于n(20
n
300)個數據,莖葉圖最大行數不超過
L=[10×lg(n)]莖葉圖類似于橫置的直方圖,但又有區別直方圖可觀察一組數據的分布狀況,但沒有給出具體的數值莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保留了原始數據的信息未分組數據—莖葉圖
(例題分析)未分組數據—莖葉圖
(擴展的莖葉圖)未分組數據—箱線圖
(boxplot)用于顯示未分組的原始數據的分布箱線圖由一組數據的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數據的5個特征值,即最大值、最小值、中位數Me
和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分(位)數畫出箱子,再將兩個極值點與箱子相連接未分組數據—單批數據箱線圖
(箱線圖的構成)中位數4681012QUQLX最大值X最小值簡單箱線圖未分組數據—單批數據箱線圖
(例題分析)最小值141最大值237中位數182下四分位數170.25上四分位數197140150160170180190200210220230240某電腦公司銷售量數據的箱線圖分布的形狀與箱線圖
對稱分布QL中位數
QU左偏分布QL中位數
QU右偏分布QL
中位數
QU不同分布的箱線圖未分組數據—多批數據箱線圖
(例題分析)【例3.4】
從某大學經濟管理專業二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征11名學生各科的考試成績數據課程名稱學生編號1234567891011英語經濟數學西方經濟學市場營銷學財務管理基礎會計學統計學計算機應用基礎76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數據—多批數據箱線圖
(例題分析)8門課程考試成績的箱線圖11名學生8門課程考試成績的箱線圖Min-Max25%-75%Medianvalue455565758595105學生1學生2學生3學生4學生5學生6學生7學生8學生9學生10學生11未分組數據—多批數據箱線圖
(例題分析)數值型數據的圖示時間序列數據—線圖時間序列數據—線圖
(lineplot)
繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數據繪在縱軸圖形的長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數據下端應從“0”開始,以便于比較。數據與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數據—線圖
(例題分析)【例3.5】已知1991~2000年我國城鄉居民家庭的人均收入數據如表。試繪制線圖1991~2000年城鄉居民家庭人均收入年份城鎮居民農村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0708.6784.0921.61221.01577.71926.12091.12162.02210.32254.4時間序列數據—線圖
(例題分析)數值型數據的圖示多變量數據—雷達圖多變量數據—雷達圖
(radarchart)顯示多個變量的圖示方法在顯示或對比各變量的數值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區域成正比可用于研究多個樣本之間的相似程度多變量數據—雷達圖
(雷達圖的制作)
設有n組樣本S1,S2,…Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的雷達圖,其具體做法是
先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖多變量數據—雷達圖
(例題分析)【例3.6】2000年我國城鄉居民家庭平均每人各項生活消費支出構成數據如表。試繪制雷達圖。2000年城鄉居民家庭平均每人生活消費支出構成(%)項目城鎮居民農村居民
食品衣著家庭設備用品及服務醫療保健交通通訊娛樂教育文化服務居住雜項商品與服務39.1810.018.796.367.9012.5610.015.1749.305.754.525.245.5811.1815.473.14多變量數據—雷達圖
(例題分析)數據類型及圖示
(小結)頻數分布的類型頻數分布的類型對稱分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數分布本節小結數據預處理的內容和目的品質分布數列的整理與顯示方法變量分布數列的整理與顯示方法用SPSS作頻數分布表和圖形結束第二節數據集位置的測度一、平均指標的概念和作用二、算術平均數三、調和平均數四、幾何平均數五、眾數六、中位數和分位數七、各種平均數之間的相互關系八、正確應用平均指標的原則一、平均指標的概念和作用一、平均指標的概念和作用平均指標的作用:可用于同類現象在不同空間條件下的對比可用于同一總體指標在不同時間的對比可作為論斷事物的一種數量標準或參考可用于分析現象之間的依存關系和進行數量上的估算。二、算術平均數二、算術平均數算術平均數的基本公式算術平均數
(計算公式)設一組數據為:X1,X2,…,XN簡單算術平均數的計算公式為設分組后的數據為:X1,X2,…,XK相應的頻數為:F1,F2,…,FK加權算術平均數的計算公式為簡單算術平均數
(算例)原始數據: 10 5 9 13 6 8加權算術平均數
(算例)某車間50名工人日加工零件均值計算表按零件數分組組中值(Xi)頻數(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0【例3.7】根據下表數據,計算50名工人日加工零件數的均值加權算術平均數
(權數對均值的影響)
甲乙兩組各有10名學生,他們的考試成績及其分布數據如下
甲組:考試成績(X): 020100
人數分布(F):118
乙組:考試成績(X): 020100
人數分布(F):811X甲0×1+20×1+100×8n
10i=1
Xi
82(分)X乙0×8+20×1+100×1n
10i=1
Xi
12(分)算術平均數
(數學性質)
2.如果每個變量值都加或減任意數值A,則,平均數也要增多或減少這個數A。
1.算術平均數與總體單位數的乘積等于總體各單位標志值的總和。算術平均數
(數學性質)3.如果每個變量值都乘以或除以任意數值A,則平均數也要乘以或除以這個數A。
5.各變量值與均值的離差平方和最小4.各變量值與均值的離差之和等于零。算術平均數的簡捷計算法Xo為假定平均數,取靠近數列中間那一組的組中值;d為組距,一般情況下,d?。╔-Xo)差數的最大公約數算術平均數的簡捷計算法
(算例)某企業工人日產量的算術平均數簡捷計算法按日產量分組(千克)工人人數
fi組中值
Xi60以下60~7070~8080~9090~100100~110110以上10195036271485565758595105115-3-2-10123-30-38-500272824合計164---39【例3.8】算術平均數的簡捷計算法
(算例)工人平均日產量:算術平均數的不足算術平均數易受極端變量值的影響,使得平均數代表性變??;而且受極大值的影響大于受極小值的影響。當組距數列為開口組時,由于組中值不易確定,使平均數的代表性部很可靠。三、調和平均數調和平均數
(概念)調和平均數又稱為“倒數平均數”,它是各個變量值倒數的算術平均數的倒數。計算公式為調和平均數
(概念)調和平均數是算術平均數的變形,兩者的計算結果是相同的,僅計算的過程不同調和平均數
(算例:由平均數計算)某日三種蔬菜的批發成交數據蔬菜名稱批發價格(元)
Xi成交額(元)m=XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例3.9】某蔬菜批發市場三種蔬菜的日成交數據如下表,計算三種蔬菜該日的平均批發價格調和平均數
(算例:由相對數計算)某公司各企業計劃完成程度情況工廠計劃完成程度(%)
Xi計劃產值(萬元)fi實際產值(萬元)m=Xifi甲乙丙9510511512001280020001140134402300合計—1600016880【例3.10】某工業公司有三個工廠,已知其計劃完成程度(%)及計劃產值資料如下表,計算平均計劃完成程度。調和平均數特點:數列中各標志值不能為零;受極端值影響,并且受極小值的影響大于受極大值的影響,但比算術平均數受極端值的影響要小。四、幾何平均數幾何平均數
(概念要點)
幾何平均數又稱“對數平均數”,它是若干項變量值連乘積開其項數次方的算術根。當各項變量值的連乘積等于總比率或總速度時,適宜用幾何平均數計算平均比率或平均速度。幾何平均數
(簡單幾何平均數)其計算公式為可以用對數形式表示為幾何平均數
(簡單幾何平均數算例)某工業產品產量平均發展速度計算表年份產品產量(億噸)逐年發展速度(X)(各年產量為前一年的%)逐年發展速度的對數(lgX)1993199419951996199719989.8010.5410.8010.8711.1611.41-107.6102.5100.6102.7102.2-2.03192.01072.00252.01152.0094合計—-10.0660【例3.11】我國某工業產品1994~1998年期間產量資料如下表,計算產品平均發展速度。幾何平均數
(簡單幾何平均數算例)平均發展速度:用對數計算幾何平均數
(加權幾何平均數)其計算公式為可以用對數形式表示為幾何平均數
(算例)【例3.12】投資銀行43年的利率分配為:1年為3%,4年為5%,8年為8%,10年為10%20年為15%。計算平均年利率。某投資銀行平均年利率計算表年利率發展速度(%)X年份f年利率發展速度的對數(lgX)flgX
10310510811011514810202.01282.02122.03342.04142.06072.01288.084816.267220.414041.214合計43-87.9929幾何平均數
(算例)45年的平均年利率為11.2617%幾何平均數
(特點)數列中標志值不能為零或負;受極端值影響較算術平均數和調和平均數要小,較穩?。贿m用于反映特定現象的平均水平,即現象的總體標志值不是各單位標志值的總和,而是各單位標志值的連乘積。五、眾數眾數
(概念要點)集中趨勢的測度值之一出現次數最多的變量值不受極端值的影響可能沒有眾數或有幾個眾數總體的單位數較多,且分配集中,不呈均勻分布,總數才有意義眾數
(眾數的不唯一性)無眾數
原始數據:10591268一個眾數
原始數據:65
9855多于一個眾數
原始數據:252828
364242品質數列或單項數列的眾數
(算例)某城市居民關注廣告類型的頻數分布
廣告類型人數(人)比例頻率(%)
商品廣告服務廣告金融廣告房地產廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100【例3.13】計算眾數解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調查的200人當中,關注商品廣告的人數最多,為112人,占總被調查人數的56%,因此眾數為“商品廣告”這一類別,即
Mo=商品廣告品質數列或單項數列的眾數
(算例)【例3.14】解:這里的數據為定序數據。變量為“回答類別”。甲城市中對住房表示不滿意的戶數最多,為108戶,因此眾數為“不滿意”這一類別,即
Mo=不滿意甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)
非常不滿意
不滿意
一般
滿意
非常滿意24108934530836311510合計300100.0組距數列的眾數
(要點及計算公式)1.眾數的值與相鄰兩組頻數的分布有關2.
公式假定眾數組的頻數在眾數組內均勻分布3.相鄰兩組的頻數相等時,眾數組的組中值即為眾數Mo組距數列的眾數
(要點及計算公式)4.相鄰兩組的頻數不相等時,眾數采用下列近似公式計算組距數列的眾數
(算例)某車間50名工人日加工零件數分組表按零件數分組頻數(人)累積頻數105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例3.15】眾數的特點是位置平均數,只考慮總體分布中最頻繁出現的變量值,不受極端值和開口組的影響,增強了其代表性;當分布數列中無明顯的集中趨勢而呈均勻分布時,無眾數;當變量數列不等距分組時,眾數不易確定。六、中位數和分位數中位數
(概念要點)集中趨勢的測度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響各變量值與中位數的離差絕對值之和最小,即未分組數據的中位數
(計算公式)未分組數據:未分組數據的中位數
(5個數據的算例)原始數據: 2422212620排序: 2021222426位置: 123
45中位數
22
未分組數據的中位數
(6個數據的算例)原始數據:105 91268排序: 56891012位置: 123
4
56位置
N+126+123.5中位數
8+928.5
品質數列或單項數列的中位數
(計算方法)1.位置公式:2.計算各組的累計頻數3.根據中位數的位置找出中位數單項數列的中位數
(算例)某廠工人日產零件中位數計算
按日產零件分組(件)工人數(人)向上累計頻數向下累計頻數26313234364131014271883132754728080775753268合計80--【例3.16】從向上累計和向下累計中可以找到累計頻數有40的那一組的標志值為34,即Me=34件品質數列的中位數
(算例)【例3.17】解:中位數的位置為:
300/2=150從累計頻數看,中位數的在“一般”這一組別中。因此
Me=一般甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)累計頻數
非常不滿意
不滿意
一般
滿意
非常滿意2410893453024132225270300合計300—組距數列的中位數
(要點及計算公式)根據位置公式確定中位數所在的組假定中位數組的頻數在該組內均勻分布采用下列近似公式計算:Sm-1
中位數所在組以前各組的累計次數(向上累計);Sm+1
中位數所在組以后各組的累計次數(向下累計)。組距數列的中位數
(計算公式幾何證明)某班統計學學習成績成績(Xi)人數(Fi)向上累積頻數向下累計頻數60以下60~7070~8080~9090~100371093310202932322922123【例3.18】某班統計學成績如下表,計算中位數中位數組為70~80分組距數列的中位數
(計算公式幾何證明)組距數列的中位數
(算例)某車間50名工人日加工零件數分組表按零件數分組頻數(人)向上累積頻數向下累計頻數105~110110~115115~120120~125125~130130~135135~1403581410643816304046505047423420104合計50—【例3.19】計算50名工人日加工零件數的中位數四分位數
(概念要點)1. 集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值3.不受極端值的影響Q1QMQ325%25%25%25%四分位數
(位置的確定)未分組數據:組距分組數據:下四分位數(Q1)位置=N+14上四分位數(Q3)位置=3(N+1)4下四分位數(Q1)位置=N4上四分位數(Q3)位置=3N4未分組數據的四分位數
(7個數據的算例)原始數據:
2321 3032 282526排序:2123
2526283032位置:1 23 4567N+1Q1=237+1Q1位置=4=4=2Q3位置=3(N+1)43(7+1)4==6Q3
=30
未分組數據的四分位數
(6個數據的算例)原始數據:2321 30 282526排序:212325262830位置:1 2 3 4 56Q1=21+0.75(23-21)=22.5Q1位置=N+
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商場補償商戶合同協議
- 房產保險購買協議
- 快遞代收貨款合同協議
- 和作協議書合同
- 戀愛分協議書范本
- 死壓車合同協議
- 快餐店出租合同協議
- 商業門店預售合同協議
- 快遞紙箱定購合同協議
- 武術館退費合同協議
- 2025年公開招聘衛生系統工作人員歷年管理單位筆試遴選500模擬題附帶答案詳解
- 智能垃圾桶產品介紹
- 2025深圳勞動合同下載
- 建筑工地住房安全協議書(2篇)
- 【MOOC】中醫與辨證-暨南大學 中國大學慕課MOOC答案
- 設備稼動率分析報告
- 湖北省襄陽市2024年中考數學試題(含解析)
- 2024年上海市交大附中高三語文期中考試作文題目解析及范文:松弛感
- 婚戀-職場-人格學習通超星期末考試答案章節答案2024年
- 裝卸搬運合同書
- 《2.1.2橢圓的簡單幾何性質》作業設計方案
評論
0/150
提交評論