應用商務統計學講義-第一章-中英文對照課件_第1頁
應用商務統計學講義-第一章-中英文對照課件_第2頁
應用商務統計學講義-第一章-中英文對照課件_第3頁
應用商務統計學講義-第一章-中英文對照課件_第4頁
應用商務統計學講義-第一章-中英文對照課件_第5頁
已閱讀5頁,還剩25頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Ch0:FirstThingsFirst

and

Ch1:Definingandcollectingdata

LearningObjectivesWhatisStatistics?什么是統計學BasicconceptsinStatistics統計學中的基本概念Data,variable,population,sample,parameter,statistic,etc…數據、變量、人口樣本統計量、參數,等等……Data/variabletypes數據/變量類型Howtocollectdata如何收集數據Thedifferentwaystocollectasample收集樣本的不同方法Thetypesofsurveyerrors調查誤差的類型1Ch0:FirstThingsFirst

and

WhatisStatistics?Statisticsreferstomethodsthathelptransformdataintousefulinformationfordecisionmakers.統計指的是幫助決策者將數據轉化為有用信息的方法。Statisticsisawayofthinkingthatcanleadtobetterdecisions.統計是一種可以帶來更好決策的思維方式。2WhatisStatistics?StatisticsWhyStatistics?Intoday’sdigitalworldeverincreasingamountsofdataaregathered,stored,reportedon,andavailableforfurtherstudy.Businessinformationsystems?在當今的數字世界中,越來越多的數據被收集、存儲、報告,并可供進一步研究。-商業信息系統Youheartheworddataeverywhere.你到處都聽到“數據”這個詞。Dataarefactsabouttheworldandareconstantlyreportedbyaneverincreasingnumberofsources.數據是關于世界的事實,并且不斷地被越來越多的來源所報道。3WhyStatistics?Intoday’sdigiToProperlyApplyStatisticsYouShouldFollowAFrameworkToMinimizePossibleErrors

為了正確地應用統計數據,您應該遵循一個框架,以盡量減少可能出現的錯誤。

InthiscoursewewilluseDCOVADefinethedatayouwanttostudyinordertosolveaproblemormeetanobjectiveCollectthedatafromappropriatesourcesOrganizethedatacollectedbydevelopingtablesVisualizethedatabydevelopingchartsAnalyzethedatacollectedtoreachconclusionsandpresentresults在這個過程中我們將使用DCOVA-定義你想研究的數據,以解決問題或達到一個目標。-從適當的來源收集數據-組織開發表收集的數據-通過開發圖表來可視化數據-分析收集到的數據,得出結論并給出結果4ToProperlyApplyStatisticsYUsingTheDCOVAFrameworkHelpsYouToApplyStatisticsTo:

使用DCOVA框架幫助你申請統計:

Summarize&visualizebusinessdata總結和可視化業務數據Reachconclusionsfromthosedata從這些數據中得出結論Makereliableforecastsaboutbusinessactivities對業務活動作出可靠的預測Improvebusinessprocesses改進業務流程5UsingTheDCOVAFrameworkHelpBusinessAnalytics:TheChangingFaceOfStatistics

商業分析:統計數據的變化Useinformationsystemsmethodstocollectandprocessdatasetsofallsizes,includingverylargedatasetsthatwouldotherwisebehardtoexamineefficiently.?使用信息系統方法收集和處理各種大小的數據集,包括非常大的數據集,否則很難有效地檢查這些數據集。Usestatisticalmethodstoanalyzeandexploredatatouncoverunforeseenrelationships.

?使用統計方法分析和探索數據,以發現不可預見的關系。Usemanagementsciencemethodstodevelopoptimizationmodelsthatimpactanorganization’sstrategy,planning,andoperations.

?使用管理科學方法開發影響組織戰略、規劃和運作的優化模型。Thegrowthof“BigData”spurstheuseofbusinessanalytics?“大數據”的增長刺激了商業分析的應用“Bigdata”orverylargedatasetsarearisingbecauseoftheautomaticcollectionofhighvolumesofdataatveryfastrates.

?“大數據”或非常大的數據集的出現,是因為以非常快的速率自動收集大量數據。6BusinessAnalytics:TheChangiDataVocabulary數據的詞匯Data:measurementsthatarecollected,recorded,andsummarizedforpresentation,analysis,andinterpretation–數據:收集、記錄和總結用于陳述、分析和解釋的測量Variable:characteristicoftheelementswhosevaluesmaydifferfromelementtoelementandisofinteresttothedatacollector變量:元素的特征,其值可能不同于元素到元素,并且對數據收集器感興趣。Element:anentityorobjectonwhichdataarecollected.Alsocalledcase,subject,individual,item-元素:收集數據的實體或對象。也稱案件、主體、個人、項目Observation:measurementofavariableonasingleelement-觀察:單個元素上變量的測量7DataVocabulary數據的詞匯Data:measDataVocabularyCaseNameAgeIncomePositionGender1Frieda45$67,100PersonneldirectorF2Stefan3256,500OperationsmanagerM3Barbara5588,200MarketingVPF4Donna2759,000StatisticianM5Larry4636,000SecurityguardF6Alicia5268,500ComptrollerM7Alex6592,500ChiefexecutiveM8Jaime5071,200PublicrelationsF5variables8subjects/elements/individuals/items40observations8DataVocabularyCaseNameAgeIncoDataVocabularyTypesofVariables變量類型Qualitative:labelsornamesforacharacteristic(position,gender,name)

-定性:特征的標簽或名稱(位置,性別,名字)Quantitative:measurementofamountorquantity-定量:量或量的測量Discrete(counting)(#offamilynumbers):limitedvaluesinarange離散(計數)(#家屬):在一個有限的范圍值Continuousvariable(measuring)(age,income):anyvalueinarange?連續變量(測量)(年齡,收入):某一范圍內的任何值9DataVocabularyTypesofVariabDataVocabularyVariabletypesQualitative(Nominal,categorical)Quantitative(Numerical)DiscreteContinuousWords?Integers?10定性的(名義的,明確的變量類型定量(數值)分離的,不相關聯的連續的整數?語言?DataVocabularyVariabletypesQAmountofInformation1.Nominallevel2.Ordinallevel3.Intervallevel4.RatiolevelNoorderordered/rankede.g.EyecolorRatingofaprofessor

AbsolutezeroDifferenceismeaningfulRatioisalsomeaningfulSalaryLevels/ScalesofmeasurementNotruezeroDifferenceismeaningfulRatioisnotmeaningfulTemperatureFourLevelsofMeasurement11測量的四個層次信息量水平/測量尺度1。標稱等級2。順序層次3.區間水平4.率水平AmountofInfoFourLevelsofMeasurementQualitativedata:NominalandOrdinallevelsNominalscale/level:Valuesrepresentcategoryorgroupmembershipofelements.Onlyshowdifference).Noorderimplied.?定性數據:名詞和序數級-名義量表/級別:值表示元素的類別或組成員關系。僅表現出差異)。無訂單暗示。Ordinalscale/level:valuesconveylessthan,equalto,andgreaterthanrelationshipsamongelements,i.e.therelativeranksoftheelementswithrespecttotheirvaluesforthevariableinquestion(onebetterthananother?)(ratingsofcustomerservice:good,average,poor)–-序數量/等級:值傳遞小于,等于,大于元素之間的關系,即相對于變量的值的元素的相對秩(一個比另一個更好?)(客戶服務等級:好的,一般的,差的)

12FourLevelsofMeasurementQualFourLevelsofMeasurementQuantitativedata:IntervalandRatioScalesIntervalscale/level:thedifferencebetweenmeasurementsisameaningfulquantitybutdoesnotinvolveatruezeropointFahrenheittemperature:differencebetween68-70isthesameas70-72.0degreedoesnotmeannotemperature.?定量數據:區間和比率標度-間隔刻度/水平:測量之間的差異是有意義的數量,但不包括真正的零點。?華氏溫度之間的差別是:6870-72相同。0度并不意味著沒有溫度。Ratioscale:valuescantakeonanaturalorabsolutezeroandratioismeaningfulSalary:0meansnoincome.40000istwiceasmuchas20000.80000istwiceasmuchas40000.比例標尺:值可以是自然的或絕對的零,比率是有意義的。?工資:0表示沒有收入。40000是20000的兩倍。80000是40000的兩倍。13FourLevelsofMeasurementQuanDatacollectionmethods

數據收集方法Datadistributedbyanorganizationoranindividual由組織或個人分發的數據Adesignedexperiment設計的實驗Asurvey/Anobservationalstudy調查/觀察性研究Datacollectedbyongoingbusinessactivities正在進行的業務活動收集的數據14Datacollectionmethods

數據收集方法SourcesofData數據來源PrimarySources:Thedatacollectoristheoneusingthedataforanalysis§主要來源:數據采集器是一個用數據分析Datafromapoliticalsurvey§從政治的調查數據Datacollectedfromanexperiment§試驗數據采集Observeddata§觀測數據SecondarySources:Thepersonperformingdataanalysisisnotthedatacollector次要來源:進行數據分析的人不是數據采集器Analyzingcensusdata分析人口普查數據Examiningdatafromprintjournalsordatapublishedontheinternet.檢查數據從印刷刊物或在互聯網上公布的數據15SourcesofData數據來源PrimarySouMoreDefinitions更多的定義Population:entiresetofobjectsofinterest人口:一整套感興趣的對象Sample:apartofthepopulationofinterest樣本:感興趣人群中的一部分Parameter(populationcharacteristics)vs.

SampleStatistic(samplecharacteristics)參數(人口特征)與樣本統計(樣本特征)Inpractice,weusuallycollectasampletostudythecharacteristicsofapopulation在實踐中,我們通常收集樣本來研究人口的特征。16MoreDefinitions更多的定義PopulatioProcessofStatisticalInference/inferentialStats

統計推斷/推斷統計過程1.Populationconsistsofallelementsofinterests2.Asampleofitemsistakenandexamined4.Thestatisticisusedasanestimateofapopulationcharacteristic3.ThesampledataprovidesadescriptivestatisticAstudyshows…研究表明.17人口包括所有的利益因素。一個項目的樣本被接受和檢查。統計被用作人口特征的估計示例數據提供描述性統計。ProcessofStatisticalInferenSamplingExpenseSpeedDestructivenatureofdatacollectionInaccessibilityofsomeelements…Random/ProbabilitySamplingMethodsOtherapproachesWhysample?Howtosample?18抽樣為什么抽樣?怎么抽樣–費用–速度-數據收集的破壞性–交通不便的一些元素-隨機/概率抽樣方法–其他方法SamplingExpenseWhysample?18抽樣Howtosample:ProbabilitySampleInaprobabilitysample,itemsinthesamplearechosenonthebasisofknownprobabilities.ProbabilitySamplesSimpleRandomSystematicStratifiedCluster19如何抽樣:概率抽樣?在概率抽樣中,根據已知概率選擇樣本中的項。概率抽樣簡單的隨機有系統的,有規則的集群分層Howtosample:ProbabilitySamSimpleRandomSampleNumbereachunitfrom1toN?每個單元從1到nUsearandomnumbergeneratortoselectndistinctnumbersbetween1andN,inclusivelyAvailabletoolsEasiertoperformforsmallpopulationsCumbersomeforlargepopulationsRandomnumbergeneratorTableofrandomnumbersExcelfunctions:Randbetween(min,max)Add-in:SamplingWithreplacementorwithoutrep..20簡單隨機樣本?使用隨機數發生器選擇n個不同的數字之間的1和N,含可用的工具隨機數發生器?隨機數表?Excel函數:?randbetween(min,max)?加入:抽樣?更換或不帶代表對小群體來說更容易執行?龐大人口的累贅SimpleRandomSampleNumbereacSystematicSamplingPopulationelementsareanorderedsequenceFirstsampleelementisselectedrandomlyfromthefirstkpopulationelementsThen,sampleelementsareselectedataconstantinterval,k,fromtheorderedsequenceframek=Nn

,

where:n=samplesizeN=populationsizek=sizeofselectioninterval21系統抽樣?人口要素是一個有序序列第一個樣本元素是從第一k個人口元素中隨機選取的。然后,樣品的元素是在一個恒定的間隔,K的選擇,從有序的序列幀試樣量,樣本大小群體大小選擇間隔的大小SystematicSamplingPopulationSystematicSamplingInvoice0118Invoice0220Invoice0221Invoice0302Invoice0308Invoice0306Invoice0402Invoice0412Invoice0514Invoice0513N=20n=5k=N/n=4First,findarandomstartingpointThenitemsfromevery4invoicesInvoice0618Invoice0620Invoice0721Invoice0802Invoice0808Invoice0906Invoice1002Invoice1012Invoice1014Invoice111322系統抽樣發票首先,找到一個隨機出發點每4張發票的項目SystematicSamplingInvoice011StratifiedRandomSampleWhatifourpopulationcanbeclearlydividedintosubgroupsbasedonsomecharacteristicsandwewantoursampletoincludeallsubgroups?PopulationisdividedintononoverlappingsubpopulationscalledstrataArandomsampleisselectedfromeachstratumPotentialforreducingsamplingerrorProportionate-thepercentageofthesampletakenfromeachstratumisproportionatetothepercentagethateachstratumiswithinthepopulation23分層隨機樣本?如果我們的人口可以根據一些特征明確地劃分為亞組,我們希望我們的樣本包括所有子組,該怎么辦?種群分成互不重疊的亞群,稱為地層從每個階層挑選一個隨機樣本。?減少抽樣誤差的可能性?比例-從每個階層抽取的樣本比例與每個階層在人口中所占的百分比成比例StratifiedRandomSampleWhatiStratifiedRandomSampleSupposewewanttostudytheadvertisingexpendituresforthe352largestcompaniesintheUnitedStates.?假設我們想研究美國352家最大公司的廣告支出。Tomakesurethatasampleof50companiesisafairrepresentationofthe352companies,thecompaniesaregroupedonpercentreturnonequityandasampleproportionaltotherelativesizeofthegroupisrandomlyselected.24分層隨機樣本為了確保50家公司的樣本是這352家公司的公平代表,公司按股本回報率分組,而與該集團相對規模成比例的樣本是隨機的。StratifiedRandomSampleSuppoClusterSampling(two-stagesampling)Populationisdividedintonon-overlappingclustersorareas?人口分為不重疊的群體或地區。Eachclusterisaminiature,ormicrocosm,ofthepopulationAsubsetoftheclustersisselectedrandomlyforthepopulationSimplerandomsamplingfromeachclusterselected.25(兩階段抽樣)分群[組]抽象法?每一個集群都是人口的縮影或縮影。?集群的一個子集是隨機選擇的。選擇每個群集的簡單隨機抽樣。ClusterSampling(two-stagesaNonprobabilitySampleInanonprobabilitysample,itemsincludedarechosenwithoutregardtotheirprobabilityofoccurrence.Inconveniencesampling,itemsareselectedbasedonlyonthefactthattheyareeasy,inexpensive,orconvenienttosample.Inajudgmentsample,yougettheopinionsofpre-selectedexpertsinthesubjectmatter.

Snowballsampling..26非概率抽樣在非概率抽樣,項目包括有選擇不考慮其發生的概率。-在便利抽樣中,僅根據容易、便宜或便于取樣的事實選擇項目。在一個判斷樣本中,你可以得到預先選定的專家在主題問題上的意見。滾雪球抽樣NonprobabilitySampleInanonpTypesofSurveyErrorsCoverageerrororselectionbias覆蓋誤差或選擇偏移ExistsifsomegroupsarenotincludedinthepoolandhavenochanceofbeingselectedNonresponseerrororbias無回答誤差或偏差PeoplewhodonotrespondmaybedifferentfromthosewhodorespondSamplingerrorVariationfromsampletosamplewillalwaysexistMeasurementerrorDuetoweaknessesinquestiondesign,respondenterror,andinterviewer’seffectsontherespondent27測量誤差類型如果某些組不包含在池中,并且沒有被選中的機會,則存在沒有回應的人可能不同于那些做出反應的人抽樣誤差從樣品到樣品的變化總是存在的?測量誤差由于問題設計的弱點,回答錯誤,以及面試官對被告的影響。TypesofSurveyErrorsCoverageDescriptivestatisticsvsInferentialStatisticsDescriptivestatistics描述統計(學)Tabular,graphical,andnumericalmethodsusedtosummarizeoneormorecharacteristicsofasetofdata.用于概括一組數據的一個或多個特征的表格、圖形和數值方法。Transformdatainto

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論