基于感情計算的電影用戶偏好分析_第1頁
基于感情計算的電影用戶偏好分析_第2頁
基于感情計算的電影用戶偏好分析_第3頁
基于感情計算的電影用戶偏好分析_第4頁
基于感情計算的電影用戶偏好分析_第5頁
已閱讀5頁,還剩16頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

[16]。表2-1模型常見指標實際分類PositiveNegative預測結果PositiveTPFPNegativeFNTN(1)查準率(Precision),指預測結果中的真正例占所有預測結果中的正例的比例,較高的正確率表明,表明該模型具有較好的樣本鑒別能力。(2)召回率(Recall),指預測結果中真正例占真正正例的的比例。召回率較高,表明該模型對整個樣品的預測比率較高,對模型的辨識能力也較強。(3)F1,即正確率與召回率的和諧平均值,用來對模型進行綜合評價。F1值愈高,則表示模式之準確度及可信度愈高。PRF4.3構建AttentionLSTM模型文章將注意力機制融入LSTM算法中。首先構建LSTM特征模型,實現詞的語義提取,并在此基礎上引入注意機制,注意力機制方法的加權,然后使用Softmax函數,如下圖4-2所示的特定架構,實現最大限度地對所選屬性進行分類。圖4-2Softmax函數架構建構模型過程如下:輸入:輸入的數據首先通過嵌入層轉換為詞向量x0,x1,x2,…,輸出:句子X的情感分類。在語句鍵中輸入詞矢量x0,x1,x2,…,xi。詞向量進入到LSTM模型中得到隱藏層?j={?0αscore(score在每一時刻,其目的是為輸入的數據的特征矢量v進行運算:v最終通過以下公式計算出最終的預測值:y4.4不同模型的對比試驗為了證明AttentionLSTM模型在影評數據中的應用效果,使用了SVM、LSTM、Attention?LSTM等模型進行了比較實驗,取得Recall、F1值,作為模型的評價指標。其中,預處理后的數據3.1.4作為實驗的數據使用。通過對多個超參試驗中常用的控制變量方法進行對比,選擇了試驗中的試驗超參數,如下表所示:表4-1實驗超參數參數參數值參數參數值epchs100Self.in_channels50n_layers2Self.out_chanels128hidden_dim128drop_prob0.5embedding_dim3004.4.1SVM模型的實驗結果在表4-1的超參量下,通過SVM模型實驗得出的混淆矩陣如下圖4-3所示。圖4-3SVM模型的混淆矩陣由圖可知SVM模型實驗的TP為2789、FN為531、FP為676、TN為689,由此可得SVM模型實驗的Accuracy為0.74236,Precision為0.80490,Recall為0.84006,F1為0.82210。4.3.2LSTM模型的實驗結果在表4-1的超參量下的LSTM模型實驗得出的混淆矩陣如下圖4-4:圖4-4LSTM模型的混淆矩陣由圖可知AttentionLSTM模型實驗的TP為2213、FN為396、FP為457、TN為682,由此可得AttentionLSTM模型實驗的Accuracy0.77241,Precision為0.82883,Recall為0.84821,F1為0.83840。4.3.3AttentionLSTM模型的實驗結果在表4-1的超參量下的AttentionLSTM模型實驗得出的混淆矩陣如下圖4-5所示圖4-5AttentionLSTM模型的混淆矩陣由圖可知LSTM模型實驗的TP為2286、FN為323、FP為509、TN為630,由此可得LSTM模型實驗的Accuracy為0.77801,Precision為0.81788,Recall0.87619,F1為0.84603。4.5實驗結果分析從上文的實驗結果整理如下表所示:表4-2實驗超參數ModelAccurayPrecisnRecallF1SVM0.742360.80400.840060.82210LSM0.773410.82830.848210.83840Attlstm0.778010.81780.876190.84603根據前面實驗結果,得出以下結論:通過比較試驗得出的F1值,可以看出,與傳統的支持向量機相比,在更大規模的樣本上,深度學習模型能夠更好地訓練出結果。從表中得結果來看,AttentionLSTM模型的F1值為0.84603,比LSTM模型的F1值0.83840高0.763%,也是實驗中F1值最高得模型,證明了本文提出得一種將注意力機制融進模型中的AttentionLSTM模型在處理海量數據有著較相較于傳統的機器學習有著較好的效果。5總結與展望5.1總結近些年來,隨著經濟的高速發展,影視行業也得到了快速發展。吃飽穿暖后的人們開始重視起精神層面的需求,對影片的質量要求更高。因此中國的電影行業面臨著新挑戰。隨著新冠疫情的結束,我國電影行業得到復蘇,影片的種類及數量都在增長,而影評網站的評論也變得越來越多,影片制作方要如何從這些海量的評論得出有價值的信息,判斷觀眾的喜好,從而制作出符合電影市場需求的影片。本文以《深海》這部電影為例對此部電影評論進行情感分析。抓取bilibili平臺的評論并對其文本數據進行標簽處理、去除停用詞等預處理操作,本文建構了Attention-LSTM模型,并分別與LSTM和SVM模型進行實驗對比,以F1值作為對比實驗的評價標準,實驗結果表明本文的模型有著較優的情感分類性能。5.2展望隨著自然然語言處理技術的不斷進步,情感分析模型將會越來越精確,能夠更好地理解和處理自然語言的細微差別。未來的研究可以集中在以下幾個方向:模型融合:結合不同模型的優勢,例如將SVM用于特征選擇和初步分類,然后利用LSTM或AttentionLSTM處理更復雜的序列信息,可能會得到更好的性能。上下文增強:進一步研究如何更有效地整合上下文信息,特別是跨句子或段落的情感關聯,可能會提升模型在理解整體情感上的準確度。跨領域適應性:電影評論情感分析模型可能在特定類型的評價中表現良好,但對于不同領域或語境下的評論可能需要進一步調整。研究如何讓模型擁有更好的適應性和泛化能力是未來發展的一個重要方向。解釋性和可視化:隨著模型變得越來越復雜,如何提升它們的解釋性和讓模型的決策過程更加透明,將對于獲得用戶信任和進一步改進模型至關重要。實時分析:在實現實時或近實時情感分析方面,模型的計算效率和資源消耗也是未來研究的一個重要方面,這對于商業和實際應用尤為重要。這些展望,未來的研究和應用將不僅僅關注模型的性能,也會重視模型的可解釋性、適應性以及實時處理能力,以滿足不斷發展變化的實際需求。參考文獻張延宇.共享經濟背景下在線民宿預訂評價影響因素分析[D].哈爾濱工業大學,2017.崔連超.互聯網評論文本情感分析研究[D].山東大學,2016.孟梅.基于BERT-TextCNN-B的電影評論情感分析[D].上海師范大學,2021.李果.基于深度學習的國產電影評論情感分析[D].廣西師范大學,2021.張苗.基于深度學習的中文評論文本情感分析研究[D].華中科技大學,2020.梁興建,牟定雕.城市攤位可視化管理系統的設計與實現[J].四川輕化工大學學報(自然科學版),2021,34(04):48-58.丁定生.基于Attention-TreeLSTM的電影評論情感分析研究[D].華中農業大學,2022.DengSY,SinhaAP,ZhaoHM.AdaptingSentimentLexiconstoDomain-SpecificSocialMediaTexts.DecisionSupportSystems,2017,94(2):65-76.PANGB,LEEL,VAITHYANATHANS.Thumbsup?:sentimentclassificationusingmachinelearningtechniques[C]//Proceedingsofthe2002EmpiricalMethodsinNaturalLanguageProcessing.Cambridge,MA:MITPress,2002:79-86程敏.基于文本情感分析和改進的SVM股票趨勢預測研究[D].鄭州大學,2022.張成博.基于FV-SA-SVM的電影評論情感分析[D].上海師范大學,2020.DOI:10.27312/ki.gshsu.2020.000714.熱克甫·艾則子.基于深度學習的文本情感分析關鍵技術研究[D].華中科技大學,2023.楊泰然.基于LSTM及新聞情感分析的匯率數據預測研究[D].北京交通大學,2023.DOI:10.26944/ki.gbfju.2022.002368.葉生柱.面向數據降維和數據不平衡的網絡入侵檢測方法研究[D].遼寧大學,2023.DOI:10.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論