




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 基于時間因子改進個性化推薦模型 胡安明 陳惠娥摘 要:傳統推薦系統算法模型主要集中研究用戶偏好與物品的關聯性,根據用戶主觀意見進行推薦,未充分考慮用戶與物品所處的客觀環境,造成推薦時的實際偏差。本文基于傳統推薦算法引入時間因子,提高模型推薦效果。實現方法主要是通過比較引入與未引入時間因子,使用UserCF算法和ItemCF算法觀察MAE值的大小變化情況。時間因子的引入,改善了傳統推薦系統算法模型主要集中研究用戶偏好與物品的關聯性等方面的推薦失真問題,提高了模型推薦的可靠性和實用性。實驗結果表明,引入時間因子能對傳統協同過濾算法在MAE指標方面有一定提高,計算效果優于傳統推薦算法。Key:時間
2、因子;個性化推薦;協同過濾:TP311.60 :AImproved Personalized Recommendation Model based on Time FactorHU Anming1, CHEN Huie2(1.School of Computer Science and Engineering, Guangzhou Institute of Technology, Guangzhou 510540, China;2.Guangdong University of Finance, Guangzhou 510521, China)anminghu; 318802207Abstra
3、ct: Traditional model of recommendation system algorithm mainly focuses on the relationship between user preferences and items, and makes recommendations according to users subjective opinions. It fails to take into full consideration the objective environment of the user and the item, resulting in
4、actual deviation in recommendation. This paper proposes to improve model recommendation effect by introducing time factor into traditional recommendation algorithm. The improved model is realized by comparing algorithms with and without time factor, and using UserCF algorithm and ItemCF algorithm to
5、 observe the changes of MAE (Mean Absolute Error) values. Introduction of time factor improves the algorithm model of traditional recommendation system, which mainly focuses on the recommendation distortion of user preferences and the relevance of items, so to improve the reliability and practicabil
6、ity of the model recommendation. Experimental results show that introduction of time factor can improve MAE index of traditional collaborative filtering algorithm, and calculation effect is better than that of traditional recommendation algorithm.Keywords: time factor; personalized recommendation; c
7、ollaborative filtering1 引言(Introduction)近年來,隨著計算機技術的發展和網絡的普及,大量數據信息融入互聯網。面對如此巨量的數據信息資源,如何讓用戶對其進行精確高效的查詢,有效使用互聯網資源;如何根據用戶的個人偏好信息,結合客觀環境,有效地處理推薦用戶所需的信息資源,仍是目前推薦系統研究的熱點。用戶物品間的瀏覽訪問記錄和上下文輔助信息數據,為推薦系統提供了數據挖掘分析的基礎1,如何從這些復雜的數據中挖掘出準確的用戶偏好信息,也是當前研究的熱點。傳統的推薦系統模型主要關注用戶與物品的行為數據研究,根據用戶的行為數據,挖掘出用戶的特征偏好,從而進行個人用戶的推薦
8、。但這一推薦模式有兩種信息未能充分考慮:其一,用戶和物品所處的客觀環境2,例如,一個食品類型推薦模型,就不能因為用戶有夏秋季節購買冷飲食品的記錄,冬季就繼續推薦該類食品。其二,用戶與物品隨著時間推移具有普遍的群體性3,例如,冬季服裝主要以各類冬裝為主;外出就餐主要以家庭群組為單位進行。因此,本文提出一種基于時間因子改進的個性化推薦算法模型,從不同的時間點去挖掘用戶的喜好,具有較好的實用價值。2 理論基礎(Theoretical basis)傳統的推薦系統模型采用協同過濾算法,該算法的核心思想是:通過用戶與物品的歷史行為數據,構造協同過濾矩陣1,通過每一行用戶對物品的評價,和每一列所有用戶對物品
9、的評價,進行協同過濾計算2,從中篩選出用戶可能感興趣的物品。其中,分為UseCF和ItemCF算法。UserCF為基于用戶相似度推薦算法,ItemCF為基于物品相似度推薦算法;UserCF適于社交網絡推薦應用,ItemCF適于物品推薦;UserCF和ItemCF算法原理基本相同。這里以UserCF算法為例,該算法流程如圖1所示。協同過濾算法中最為重要的就是用戶相似度計算,常用的用戶相似度計算算法有余弦相似度、皮爾遜相關系數、改進皮爾遜相關系數算法三類4。(1)余弦相似度余弦相似度計算兩個用戶向量間的夾角大小,夾角越小,余弦相似度越大,則兩個用戶越相似。假設數據集中有用戶u和用戶v的物品評分,計
10、算用戶u和用戶v的相似度,如公式(1)所示;采用集合方式計算,如公式(2)所示,其中N(u)為用戶u點擊過的物品評分,N(v)為用戶v點擊過的物品評分5。(1)(2)(2)皮爾遜相關系數皮爾遜相關系數與余弦相似度相比,增加了用戶的平均分對數據進行修正,減少了用戶評分偏置項的影響5,如公式(3)所示。(3)其中,代表用戶u對物品p的評分,代表用戶v對所有物品評分的平均分,P代表所有物品的集合。(3)改進皮爾遜相關系數改進皮爾遜相關系數,將和改為物品平均分(物品所有得分的平均分),減少了物品評分偏置對結果的影響6,如公式(4)所示。(4)3 基于時間因子改進的推薦模型(Improved recom
11、mendation model based on time factor)傳統的推薦算法模型忽視了用戶喜好也會隨著時間而發生改變。例如,一個食品類型推薦模型,就不能因為用戶夏秋季節購買過冷飲食品,冬季就繼續推薦該類食品。又如,某用戶在一段時間內對Java語言感興趣,則這段時間內主要點擊的都是與Java相關的圖書。但隨著時間、工作環境等其他因素的變化,用戶又喜歡Python語言了,因而該用戶點擊的都是Python相關圖書。相比較而言,前期的Java語言類圖書不能完全代表用戶喜好,而推薦系統的目標是推薦用戶當前最喜歡的物品,因此,時間因子也是推薦系統模型需要考慮的充分因素。根據艾賓浩斯遺忘曲線規律
12、7,結合推薦模型中用戶和物品行為數據的特征,計算時間衰減函數,如公式(5)所示。(5)其中,表示用戶u對物品i發生行為的時間,表示用戶u對物品j發生行為的時間;為時間衰減因子,因子作為閾值,可調節時間的窗口期。將時間衰減模型引入余弦相似度協同過濾推薦模型8,最近行為與當前推薦物品關系最大,計算如公式(6)所示。(6)在此基礎上考慮到不活躍用戶大于活躍用戶對物品相似度的貢獻,降低不活躍用戶權重,模型改進如公式(7)所示。(7)4 基于時間因子的算法改進流程(Algorithm improvement process based on time factor)本文引入時間因子算法,相比傳統的推薦算
13、法9而言,主要改進在排序階段,當推薦算法從數據中召回與目標用戶可能感興趣的物品后,在對物品排序過程中引入時間,較好地反映出用戶在當前時間段的興趣特點,體現推薦系統的就近原則10。算法過程如圖2所示。5 實驗仿真與結果分析(Experimental simulation and result analysis)本實驗軟件環境為Windows 10操作系統、Python 3.7,硬件環境為i5-9400 2.9 GHz、內存16 GB、顯卡GTX1660(6 GB)、硬盤500 GB。實驗數據選擇MovieLens 1 MB版本數據集,該數據集中共收錄了6,000余名用戶對近4,000 部電影的1
14、00萬條評論數據,每條評論包含發表評論時間。本文采用絕對平均誤差MAE對算法進行評估,計算如公式(8)所示,其中為用戶u對物品i的實際評分,為用戶u對物品i的推薦預測。(8)本文分別使用UserCF算法和ItemCF算法,在未引入時間因子情況下和引入時間因子情況下,相似用戶近鄰數n取值1070,分別取七個值。比較引入時間因子和未引入時間因子MAE值的大小變化情況,其中時間因子超參數取值0.02,使用結果如表1、圖3和圖4所示。時間因子引入過程中,為時間因子超參數,用于控制時間因子time權重值。通過實驗分析可知,值取值0.02時MAE值最小,因此可知最近時間用戶行為數據具有較大參考價值,實驗結
15、果如圖5所示。實驗結果分析:本文使用MovieLen 1 MB數據集,在引入時間因子和未引入時間因子情況下,分別對UserCF算法和ItemCF算法進行測試。在引入時間因子情況下,實驗表明能對傳統協同過濾算法在MAE指標方面有一定提高,計算效果好于傳統推薦算法。6 結論(Conclusion)本文首先對傳統協同過濾算法計算過程進行分析,在此基礎上引入時間因子。通過實驗分析,引入時間因子對傳統的協同過濾算法有一定改進效果,為傳統的協同過濾算法的改進提供了一些思路。Reference(References)1 蘇慶,章靜芳,林正鑫,等.改進模糊劃分聚類的協同過濾推薦算法J.計算機工程與應用,201
16、9,55(5):118-123.2王國霞,劉賀平.個性化推薦系統綜述J.計算機工程與應用,2012,48(7):66-76.3 趙茂先,李小丹.一種帶自適應飛行時間因子的粒子群算法J.山東科技大學學報(自然科學版),2014,33(2):81-85.4 LANDHUIS E.Scientific literature:Information overloadJ.Nature,2016,535(7612):457-458.5 張玉潔,杜雨露,孟祥武.組推薦系統及其應用研究J.計算機學報,2016,39(4):745-764.6 蘇慶,陳思兆,吳偉民,等.基于學習情況協同過濾算法的個性化學習推薦模型研究J.數據分析與知識發現,2020,4(05):105-117.7 陶永才,曹朝陽,石磊,等.一種結合時間因子聚類的群組興趣點推薦模型J.小型微型計算機系統,2020,41(2):356-360.8 竇羚源,王新華,孫克.融合標簽特征
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025冬奧會觀看心得及啟示(4篇)
- 小學生護林防火主題演講稿(5篇)
- 格式辭職報告(5篇)
- 2025裝飾公司年終工作總結(5篇)
- 預防近視的活動學習心得(5篇)
- 人教版 (PEP)三年級下冊Unit 3 At the zoo Part A第3課時教案設計
- 上海市新版公有住房差價交換協議(17篇)
- 設備維修合同(15篇)
- 提高實驗教學有效性
- 2025研究性學習的自我評價(20篇)
- 智能音箱行業發展趨勢與市場前景深度解析
- 2024年榆林能源集團有限公司招聘工作人員筆試真題
- 山東省濰坊市高密市2024-2025學年七年級下學期4月期中數學試題(原卷版+解析版)
- 防汛抗旱合同協議
- 征地補償的合同范本
- 2025年新高考歷史預測模擬試卷3(含答案)
- 船舶壓載水和沉積物接收處理技術要求編制說明
- 區域總經銷商合同范本
- 保潔員安全知識培訓課件
- 行政管理本科畢業論文-鄉鎮政府公共政策執行力存在的問題及對策研究
- 政治薪火相傳的傳統美德教學設計 2024-2025學年七年級道德與法治下冊(統編版2024)
評論
0/150
提交評論