在線社交網絡影響力分析課件_第1頁
在線社交網絡影響力分析課件_第2頁
在線社交網絡影響力分析課件_第3頁
在線社交網絡影響力分析課件_第4頁
在線社交網絡影響力分析課件_第5頁
已閱讀5頁,還剩18頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在線社交網絡影響力分析社交影響力的相關因素社交網絡影響力的度量方法社交網絡中影響力的傳播總結與展望摘要 社交影響力分析是社交網絡分析的關鍵問題之一。近十幾年間,隨著在線社交網絡的蓬勃發展,研究人員才開始有機會在大量現實數據的基礎上對社交影響力進行建模和分析,并取得了豐碩的研究成果和廣泛的應用價值。文中闡述了社交影響力的相關概念和它們之間的關系,重點從網絡拓撲、用戶行為和交互信息等幾個方面總結了影響力分析的建模和度量方法,并對在線社交網絡影響力分析的前景進行了展望。社交影響力的相關因素 影響力 社交影響力只有通過人們之間的交互活動才能夠體現出來,比如用戶A在網上的發帖吸引了用戶B,使得后者成為A

2、的粉絲,即A對B產生了影響力。 社交影響力的定義具有明顯的因果性,而人們的思想、行為等產生變化的原因則是不勝枚舉且因人而異,社交影響力只是其中之一。目前大部分研究工作都是針對社交網絡結構及其上的交互信息和用戶行為特征進行量化和分析的,因此可以把能對信息傳播過程或他人行為產生影響的個體視為具有社交影響力。 同質性 同質性指具有相似特征的個體選擇彼此作為朋友的傾向,即所謂的“物以類聚,人以群分”。如果用戶B發現用戶A和自己有相同的興趣和愛好,因而選擇A作為自己的朋友,這種現象即是同質性的表現。社交網絡影響力的度量方法 社交網絡影響力度量的主要任務是分析和預測用戶社交影響力的大小及演化規律,為基于社

3、交影響力的研究和應用提供技術支持和理論依據。 常用的影響力度量方法大致可以劃分為基于網絡拓撲結構、基于用戶行為和基于交互信息的度量等類型。在進行社交影響力分析時,既需要根據實際情況選擇合適的度量手段,還可以綜合使用上述方法,盡可能準確客觀地刻畫社交影響力的真實面貌。 基于社交網絡拓撲結構的度量 對社交網絡進行影響力分析時,網絡結構中的節點表示用戶,而節點之間的連接則表示用戶之間建立的關系,它們在分析影響力時都起著至關重要的作用,因此我們分別以網絡節點和連接為對象介紹一些廣泛使用的度量方法。 在下文中,社交網絡的拓撲結構用圖G=(V,E)表示,如無特別說明,一般是指無向圖。其中n=|V|表示節點

4、數;表示節點i; 表示節點i和j之間的邊,很多時候也被稱之為連接; 表示圖的鄰接矩陣; 是其中的元素;如果是帶權圖,我們用 表示節點i和j之間的權重。 節點的度量 連接的度量 對連接的影響力度量即是對兩個用戶相互之間影響程度的度量。 一般而言,兩個節點的鄰居重疊程度越高,這兩個節點之間的關系越緊密,它們之間的影響力也越強烈,可以用Jaccard相似度度量這種關系:Jaccard相似度用于統計節點i和j的共同鄰居在總鄰居數中所占比例。 邊介數也可用于度量邊在網絡中的重要程度:邊介數統計的是網絡中經過邊的最短路徑的總數量。 博客圖:用有向多重圖表示節點間的影響力,弧的重數越多代表節點間的影響力越強

5、,弧的方向表示影響力的作用方向。 影響力圖:該圖是有向帶權圖,弧的方向表示影響力來源,權重代表影響力強度,用 表示從節點u到節點v之間的平行邊條數,其計算方式為 基于用戶行為的度量 一般情況下,在線社交網絡都會記錄人們通過交互活動產生的大量信息,其中就包括各種用戶行為數據。通過分析這些數據,可以衡量用戶之間的影響大小及其傳播途徑行動作a的用戶數量,與基于網絡拓撲的節點影響力度量方法不同,上述模型以動作的傳播頻率作為用戶影響力評估指標,并用動作的執行范圍度量動作本身的影響力指標。 基于用戶交互信息內容的度量 由于用戶的社交影響力能夠促進信息的傳播,所以分析在線社交網絡中信息內容的傳播范圍和時間,

6、能夠比較準確地反映用戶的影響力。 在社交網絡中,很多傳播廣泛的流行消息都是由影響力較大,擁有大量粉絲的用戶發起的,因此流行消息的傳播可以作為用戶社交影響力的判斷依據。 P(k)表示用戶在經受k次曝光后才開始使用該標簽的概率,圖中曲線表示實驗數據集中最流行的500個標簽的P(k)值的平均分布。從圖中可以間接證明時間因素在影響力度量中的重要作用。處位置的重要程度。如果用戶在社交網絡中的位置能夠如實體現他在社交活動中的領袖地位,利用基于PageRank算法的排名方法就能對其進行度量。 基于網絡結構的方法過分強調了意見領袖的“領袖”特點,即在社交網絡中地位顯赫,而忽視了他發布“意見”的重要性。因此分析

7、用戶所發信息的影響力及其傳播特性,能夠更客觀準確地發現網絡中的意見領袖。博客中的意見領袖可以根據他發布的有影響力的帖子數量進行識別,利用博文的引用數量、評論數量、新穎程度和內容長度評價帖子的影響力,從而發掘出意見領袖。通過觀察和分析用戶網絡用戶的行為特征及其傳播規律,也能對用戶的影響力大小和范圍進行度量。 上述兩類方法各有優勢和不足,基于網絡結構的方法模型簡單,計算效率高,能夠處理大規模的社交網絡,但是準確率相對較低,在真實網絡環境中存在誤判的可能性;基于交互信息的分析方法得到的結果客觀準確,但是由于涉及到大量信息的預處理和相關性的計算,難以適應規模較大的社交網絡。 策略:先利用基于網絡結構的

8、方法篩選意見領袖的備選集合,然后再利用交互信息的方法選取真正的意見領袖。 最大影響力傳播問題 最大影響力傳播問題首先是由Domingos和Richardson提出的,簡言之就是在社交網絡中尋找最有影響力的成員集合。 影響力的傳播模型 (1)獨立級聯模型 可以描述為:在社交網絡G=(V,E)中,部分用戶 在初始時刻就處于激活狀態,用戶 與其鄰居 間的影響力用 表示, 的取值是獨立的,在傳播過程中不受 和其他鄰居節點間關系的影響。如果用戶 在某一時刻t由非激活狀態變成激活狀態,則 對于非激活狀態的每一個鄰居節點,僅在t時刻有一次機會嘗試激活他。 例如, 的鄰居 在t時刻還沒有激活,則 以概率 激活

9、 ,如果成功, 從t+1時刻起處于激活狀態,但是不管成功與否, 再也不能試圖去激活 。如果 在t時刻同時有多個鄰居都變成了激活狀態,則他們嘗試激活 的順序是任意的,系統從初始態開始傳播過程,直到沒有新的用戶可以被激活為止。 (2)線性閾值模型 線性閾值模型在新產品采用等問題中應用廣泛,該模型可以描述為:在社交網絡G=(V,E)中,用戶 與其鄰居節點 間的影響力權重為 ,且 所有另據的影響力權重之和最大為1,即 任意一個用戶 都會隨機選定屬于自己的閾值 ,表示只有當 的鄰居節點對 的影響力超過該閾值, 才會被激活。與獨立級聯模型類似,初始時刻處于激活狀態 的用戶集合 ,如果截止t時刻用戶 被激活狀態的鄰居集合為 ,而 尚未被激活,則在滿足以下條件時: 從t+1時刻起變為激活狀態,且保持該狀態不變。系統從出事狀態開始演變,直到沒有新用戶被激活為止。總結與展望 本文主要介紹了在線社交網絡興起以來社交影響力分析的主要成果,首先闡述了社交影響力的基本概念和與之相關的其他因素,介紹了區分影響力和這些因素的研究工作,接著重點總結了影響力分析建模和度量方法。雖然社交影響力分析已經取得豐碩的理論和應用成果,但我們認為至少還有以下問題有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論