




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
在QA的日常測試中,有時會遇到概率事件,比如某卡片的抽中概率,某類寶物的掉落概率都需要被測試,但是具體要怎樣測試?測試多少次?出現什么結果表示測試通過?我一直沒有找到一個明確的答案,帶著這個疑問,我進行了一些資料搜索和思考,下面把我的經驗分享給大家。
,
,
,
二項分布
,
二項分布在游戲中使用的很多,比如抽卡系統,一般策劃會設定抽到xx卡的概率是多少,這個進行n次抽卡,抽到幾張xx卡的概率分布函數就是二項分布。根據定義可知,在二項分布中,n次試驗中正好得到k次成功的概率由概率質量函數給出:
"那么怎么測試這張卡被抽中的概率呢?這里看一個例子,下圖分別是概率為0.1的事件在10,100,500和1000次的事件中的出現次數的概率分布。"
可以看到隨著試驗次數的增多,中間的峰越窄,事件發生的次數越向真實概率集中,可以預見的,我們測試抽卡次數越多,所得到xx卡的數量就越接近于它的本身概率。
,
那么在測試中,如何判斷所得的結果是正確的呢?這里需要用到統計學中假設檢驗的方法。
,
通俗的說,假設檢驗大致可以理解為:小概率事件不會發生,如果發生了小概率事件,那就否定之前的假設。
,
關于統計學還有兩點額外信息,
第一:小概率可以取5%或者1%,5%在統計學中被認為是顯著的,1%在統計學中被認為是非常顯著的。
第二:假設檢驗只能證偽,而不能證明假設。
,
把以上的想法應用到概率測試中,我有如下思路:
和上圖展示的一樣,每個概率分布的主體都應該相互隔開,可以采取5%或者1%的顯著性水平,5%就是左右兩邊各有2.5%的概率越過精度間隔,1%就是0.5%的概率越過,相鄰兩個概率分布的間隔就是測試的精度。
,
舉個例子,比如一個事件A,結果B發生的概率是0.5,我進行了500次事件A的測試,發現B一共發生了235次,我對概率測試的精度要求是0.1。這些數據說明了什么呢?
,
首先,理論上概率是0.5,精度要求是0.1,那么0.45-0.55的實際測試概率都是可以接受的,一共進行了500次測試,對應到B發生的次數就是500*0.45-500*0.55,也就是225次到275次之間,而實際B發生了235次,在這個區間內。
,
其次,在0.1的精度下,也就是225次和275次時,我們來看概率是0.4或者0.6的可能性有多大:
,
">x<-pbinom(225,500,0.4)"
>print(x)
[1]0.9897285
,
">x<-pbinom(275,500,0.6)"
>print(x)
[1]0.01300643
可以看到,假設事件B發生的概率是0.4,那么實際測試時,B的次數有98.97%的概率小于等于225次,我們實際得到的是235次,在統計學的假設檢驗中,此為小概率事件,就證否了之前的假設:事件B實際發生的概率是0.4。以此類推,我們可以證否所有事件B發生概率小于0.4的假設。
,
,
同理,假設事件B發生的概率是0.6,那么它有1.3%的可能在實際測試時B發生的次數小于等于275,而我們現在得到的數據是235,這同樣證否了所有事件B發生概率大于等于0.6的假設。
"由于我們設定的精度為0.1(表示實際概率可以取值為0.1,0.2,0.3…0.9,1),所以得出結論:事件B發生的概率是0.5,符合理論,測試通過!"
,
以上就是我關于概率測試的經驗,由于在實際測試中,概率的數值和精度的需求不定,而二項分布在不同概率和不同測試次數下曲線都不一樣,我這里有一些快捷的竅門可以提供給大家:
1.
在顯著性水平為5%的情況下,精度為0.1的概率事件測試400次,而精度為0.01的概率事件測試40000次
2.
在顯著性水平為1%的情況下,精度為0.1的概率事件測試700次,而精度為0.01的概率事件測試70000次
,
最后,附上一些不同測試次數和精度下的概率分布圖,幫助大家直觀的了解二項分布:
"精度0.1下100,500和1000次試驗二項分布概率分布圖"
"精度0.01下5000,10000和50000次試驗二項分布概率分布圖
"
泊松分布
泊松分布對應的是二項分布的極端情況,當二項式分布的次數n很大,而發生的概率p很小時,就可以使用泊松分布代替二項式分布,具體來說,它的成立需要滿足三個條件
事件是小概率事件
事件是獨立的,不會互相影響
事件發生的概率是穩定的
,
先來看一個例子:
已知某家小雜貨店,平均每周售出2個水果罐頭。請問該店水果罐頭的最佳庫存量是多少?
假定不存在季節因素,可以近似認為,這個問題滿足以下三個條件:
(1)每個顧客購買水果罐頭是小概率事件(顧客的數量很多)。
(2)購買水果罐頭的顧客是獨立的,不會互相影響。
(3)顧客購買水果罐頭的概率是穩定的。
,
"在統計學上,只要某類事件滿足上面三個條件,它就服從""泊松分布""。"
,
泊松分布的公式如下:
各個參數的含義:
P:每周銷售k個罐頭的概率。
X:水果罐頭的銷售變量。
k:X的取值(0,1,2,3...)。
λ:每周水果罐頭的平均銷售量,是一個常數,本題為2。
根據公式,計算得到每周銷量分布:
從上表可見,如果存貨4個罐頭,95%的概率不會缺貨(平均每19周發生一次);如果存貨5個罐頭,98%的概率不會缺貨(平均59周發生一次)。
,
對應到游戲測試中,有什么應用呢?
,
已知某珍惜道具,平均每周掉出2個,請問該在每周掉出多少個時設置報警?看到這里,是不是立馬就得出了答案?因為游戲中,玩家的行為是未知的,就算知道了道具掉落的概率,也很難在實際中計算玩家得到道具的概率,這個時候,只使用平均每周掉出2個這一項數據,就可以根據泊松分布計算出概率分布,從而確定掉落大于多少時是小概率事件。
,
,
再舉個例子,在項目進入開發后期后,已知在游戲測試中,平均每周會有兩次crash,那么,當本周crash次數達到多少時,應該引起QA對本周周版本質量的重視呢?
,
泊松分布在游戲開發中的應用還可以有很多,我在這里拋磚引玉,相信大家只要理解了它的概念,就能輕易的找到它的應用場景。
指數分布
指數分布在游戲中也會有存在,來看一個網上的例子:
在某游戲抽卡系統中,策劃填了設置紫卡被抽中的概率是5%,策劃說,設置5%是為了給玩家抽卡20次就抽中一次的體驗。但是游戲上線后,許多玩家在抽卡時抱怨臉黑,很難抽到紫卡,而又有一部分玩家反應運氣好能連著抽到紫卡,和策劃20次中一次的預期不符。項目組第一反應是游戲中出現了bug,但是一直排查不到,這時,程序靈機一動,寫了一個模擬抽卡的程序,并畫出了圖,也就是下圖,下圖為概率5%,模擬50000次隨機得到的結果:
,
上圖中紅色的是分布圖,X軸是出現次數,Y軸是抽中紫卡間隔。而綠色的圖是概率分布圖,X軸是間隔數,Y軸是概率。
按策劃的想法,5%概率應該等同于20次出現一次,那上圖很明顯并不滿足20次出現一次出現規則,實際間隔從近到遠呈下坡形狀分布,就是說相鄰的概率最大,間隔最大超過160,這與玩家所吐槽的抽卡體驗是一致的。但50000次隨機總共出現了2508次,從統計的意義上來說又是符合5%概率的。
,
所以這個問題,究其原因就是所謂的概率是統計意義上的還是分布意義上的問題。這里,就需要介紹另一個分布:指數分布。
,
指數分布是固定概率事件的出現間隔的概率分布,應用到抽卡中,就是兩次抽中xx卡之間間隔抽卡次數的分布。它的公式網
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖書館裝修項目解除合同
- 智能家居居間合同示例范本
- 電子商務的社交化與分享經濟
- 痛風與高尿酸血癥的護理
- 化工品倉儲運輸安全協議
- 教育銷售員工培訓
- 家具定制采購合同
- 2024湘潭市工業貿易中等專業學校工作人員招聘考試及答案
- 2024湖南曙光科技技工學校工作人員招聘考試及答案
- 2024湖北職業技術學院衛生技術學院工作人員招聘考試及答案
- 倉儲設備操作安全操作培訓
- 上海電機學院計算機C語言專升本題庫及答案
- 幼兒園公開課:大班語言《相反國》課件(優化版)
- 2023年寧波房地產市場年度報告
- 員工身心健康情況排查表
- 模擬小法庭劇本-校園欺凌
- 危險化學品經營企業安全評價細則
- 哈利波特與死亡圣器下雙語電影臺詞
- 10以內數字的分解和組成
- 課堂教學技能講座課件匯編
- 湖北2022年中國郵政儲蓄銀行湖北省分行社會招聘考試參考題庫含答案詳解
評論
0/150
提交評論