




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基礎數據分析介紹
張曉軍2016.8.11下面的結論對嗎?外長寬尺寸位置我們的感覺可靠嗎?上面的藍線和黑線哪根長?人=吃飯+睡覺+上班+玩豬=吃飯+睡覺,代入:人=豬+上班+玩,即:人-玩=豬+上班.結論:不懂玩的人=會上班的豬男人=吃飯
+睡覺
+
掙錢豬=
吃飯
+睡覺男人=豬
+
掙錢豬=
男人
-
掙錢結論:男人不掙錢等于豬。女人=吃飯
+睡覺
+
花錢。豬=
吃飯
+睡覺。代入上式得:女人=豬
+
花錢。移項得:女人
-
花錢=豬。結論:女人不花錢的都是豬。男人+女人=2吃飯+2睡覺+掙錢+花錢=2(吃飯+睡覺)=2豬結論:男人+女人就是兩頭豬思考:問題出在哪里?提綱什么是數據數據分析可以幫你作什么工作中如何作有效的數據分析一些數據分析的常用方法如何有效地展現分析結果什么是數據?數據是使用約定俗成的關鍵詞,對客觀事物的數量、屬性、位置及其相互關系進行抽象表示,以適合在這個領域中用人工或自然的方式進行保存、傳遞和處理。二進制周圍的事物中,幾乎所有事物都可以用數據的形式去表達。數據分析是“神馬”
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。以求最大化地開發數據的功能,發揮數據的作用。數據類別質量管理:定性型數據、定量型數據數據分析:維度數據、度量數據
維度數據,更多的是定性類數據,是描述事物的各種屬性信息。度量數據,也叫指標數據,是具體的計算用的量化數值我們在做數據分析時,歸根結底就是在不停的做各種維度和度量的組合。抽樣與總體抽樣研究的目的是要用樣本信息推斷總體特征和未來趨勢,稱統計推斷
死后鞭尸遠沒有積極預防更有價值由于個體變異的存在,在抽樣研究中產生樣本統計量和總體參數之間的差異,稱為抽樣誤差(必然存在)
n>30時,樣本標準差服從近似正態分布,抽樣誤差的標準差稱為標準誤當總體一定時,樣本例數越多,標準誤越小,可信度越高。數據分析可以幫你做什么?數據分析可以幫你做什么誰的表現最好?我們公司的效益好不好?不良那么高的原因是什么?我們的人是否還可以壓縮?你是否適合做股票投資?如何識別恐怖分子?工作中你做過的數據分析工作中如何作有效的數據分析做數據分析的前提熟悉業務流程明確目的干啥事,總得有個預期!提升利潤?增加銷量?人員溝通?制訂策略?解決段差問題?…數據收集收集方案:推理、假設、討論目標分解:數學模型標準化:制定數據記錄矩陣表數據記錄:檢驗對象,收集數據數據收集_收集方案預則立、不預則廢數據收集_目標分解利潤=收入-成本如收入再分解:銷售收入、服務收入、政府補助,成本分解:薪資、物料成本、水電、房租、差旅、稅務、保險等。RMA=累計返修數量/累計出貨數量尺寸鏈A1=A2-A3-A0數據收集_數據要求數據收集要求:結構化規范化可關聯數據處理數據清洗數據轉化數據提取數據計算數據處理_“臟數據”數據分析常用數據分析方法:聚類分析因子分析相關分析對應分析回歸分析方差分析崩潰數據分析_大道至簡比較細分比較的印象分析前認識幾個概念分析前認識幾個概念比較研究比較研究是根據一定的標準或維度,對兩個或兩個以上有聯系的事物進行考察,尋找其異同,探求其普遍規律與特殊規律的方法。實物的相異性和共同性,構成了比較法的客觀基礎。比較研究方法的分類按屬性的數量,可分為單項比較和綜合比較。
單項比較是按事物的一種屬性所作的比較。綜合比較是按事物的所有(或多種)屬性進行的比較按時空的區別,可分為橫向比較與縱向比較。
橫向比較(類型比較法):指同一時期不同對象進行對比分析,或同一類事物內部不同部分之間進行對比。縱向比較(歷史比較法):指同一對象在不同時期的狀況進行對比分析。
按目標的指向,可分成求同比較和求異比較。求同比較是尋求不同事物的共同點以尋求事物發展的共同規律。求異比較是比較兩個事物的不同屬性,從而說明兩個事物的不同,以發現事物發生發展的特殊性。。按比較的性質,可分成定性比較與定量比較。
定性比較就是通過事物間的本質屬性的比較來確定事物的性質。定量比較是對事物屬性進行量的分析以準確地制定事物的變化。
通過比較得出什么結論偏差與比較對象的偏離程度,與標準的偏離程度,觀察的是一致性的程度趨勢不同維度指標在時間軸上的趨勢,有什么規律,向好還是向壞,是擴大還是收斂,觀察的是動態的變化波動與比較對象均值之間的偏離程度,觀察的是穩定性能力關聯反映比較對象之間不同維度之間的內在聯系數據分析_比較的工具QC七大手法數據分析_比較的工具要表達的數據和信息餅圖柱形圖條形圖拆線圖氣泡圖其它成分
(整體的一部分)排序
(數據的比較)時間序列(走勢、趨勢)頻率分布(數據頻次)相關性(數據的關系)多重數據比較比較訓練實例_RMA比較方法屬性時空指向性質比較結論偏差趨勢波動關聯舉例說明經營狀況直升邊高度家庭開支體重數據分析_分類所謂分類方法,是根據事物的相同點或相異點,將它們區分為不同種類,從而認識事物共同本質的思維方法。分類方法和比較方法有密切的聯系。在認識事物時,總是先進行比較,識別它們的共同點和差異點,然后分類研究。分類方法分類是數據挖掘的重要基礎,也是機器學習、模式識別和人工智能等相關領域廣泛研究的基礎。分類的方法眾多,一般可以按如下的兩類方法做基本分類:按現象分類
按事物的表現現象分,如不良表現,分為外觀不良、尺寸不良、功能不良;如外觀不良又可以按現象細分為刮傷、塵點、毛邊、偏色等。按本質分類
按事物的性質特點,如生產者可按不同地區、不同廠商、不同時段、不同產線、不同班組等進行分類。分類注意事項分類的根據任何分類都包含三個要素:分類的母項、分類的子項和分類的根據。分類的規則同一根據子項互不相容子項和必須等于母項。
分類按層次順序決策樹是很好的一種分類方法決策樹(DecisionTree)又稱為判定樹,是運用于分類的一種樹結構。其中的每個內部結點(internalnode)代表對某個屬性的一次測試,每條邊代表一個測試結果,葉結點(leaf)代表某個類(class)或者類的分布(classdistribution),最上面的結點是根結點。決策樹分為分類樹和回歸樹兩種,分類樹對離散變量做決策樹,回歸樹對連續變量做決策樹。數據展現用圖表的方式,輔于簡要的說明,將分析的結果清晰呈現給你的受眾。讓老板在30秒種內讀懂你的數據!!常用圖表類型選擇指南報告_經驗總結&傳承邏輯嚴謹結論直觀簡潔易懂回歸質量觀建立預期識別現狀分析偏差持續改善數據收集比較&細分對策質量基本原理數據分析原理所有的分析要從“結果”出發,沒有結論的數字羅列并不是分析;而“結果”就是發現問題和解決問題。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年山西電力職業技術學院高職單招職業技能測試近5年常考版參考題庫含答案解析
- 2025年山東服裝職業學院高職單招(數學)歷年真題考點含答案解析
- 2025年安徽水利水電職業技術學院高職單招(數學)歷年真題考點含答案解析
- 學校傳染病防治知識培訓
- Axure培訓課件教學課件
- acls培訓課件教學課件
- 新發展英語(第二版)綜合教程3 課件 Unit 4 Expressing Compliments Appreciation and Encouragement
- 人教版數學六年級下冊難點解決問題專項集訓
- 南京工業大學浦江學院《金融數據挖掘》2023-2024學年第二學期期末試卷
- 2025年安徽省宣城市郎溪縣七校第二學期高三英語試題期中考試試題含解析
- 產品履歷表完
- 保健食品備案產品可用輔料及其使用規定
- 南京大學儀器分析習題集
- 《中國名山介紹模板》課件
- 肺癌伴胸腔積液護理查房
- Rational Rose 建模-家庭收支管理系統
- 旅游策劃期末試卷B卷-旅游策劃(哈工大出版社)配套材料
- 健康管理中的健康教育與健康促進研究
- TY/T 1106-2023群眾體育賽事活動運營服務規范
- 北師大版心理健康六年級上冊第十四課欣賞我自己 課件
- 2024年中考化學復習把握中考方向共研備考策略
評論
0/150
提交評論