DB4401-T 12-2023 網絡輿情分級與判定_第1頁
DB4401-T 12-2023 網絡輿情分級與判定_第2頁
DB4401-T 12-2023 網絡輿情分級與判定_第3頁
DB4401-T 12-2023 網絡輿情分級與判定_第4頁
DB4401-T 12-2023 網絡輿情分級與判定_第5頁
已閱讀5頁,還剩11頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

11

4401 DB4401/T

DB

4401/T

網絡輿情分級與判定Classification

and

judgment

network

public

opinion2023-05-31發布 廣州市市場監督管理局 發

122023

4.1

4.2

4.3

4.4

4.5

7.1

7.2

7.3

7.4

8.1

8.2

8.3

10

109.1

109.2

11

12

13

122023 本文件按照GB/T

1.1—2020《標準化工作導則

第1部分:標準化文件的結構和起草規則》的規定

DB

本文件與DB

201820189.120187.19.220187.22018年首次發布為DB

122023

3.1

of

3.2

of

opinion

strength3.3

of

attitude

orientation3.4

of

opinion

development

4.1

DB4401/T

1220234.2

4.3

4.4

4.5

網絡輿情評價應遵循一定的工作流程,主要包括輿情監測、輿情評價、輿情研判三個環節,如圖1圖1

122023

圖2

7.1

m

1媒體集中度反映參與媒體的集中程度,采用赫爾芬達爾-赫希曼指數的公式進行計算,可按照公式(1)。媒體集中度越高,意味著媒體的壟斷力量越大、競爭程度越低、差異化程度越低、越容易形成輿DB4401/T

122023

i

i

1

i1

c

2

2

2

m1

mi

c

M2媒體權威度反映了網絡媒體的可信度和影響力,可按照公式(2)進行計算。媒體權威度越高,表明Nii12

mi

媒體權重,由輿情監測主體根據預定義的媒體分類表,經過歸一化處理后賦值,數值范圍

M3基于詞頻-逆文檔頻率指數統計學方法(

Frequency通過方法統計所有稿件的關鍵詞,得到統一的詞向量;隨后將不同稿件的詞向量兩兩組合,得

個組合的雙詞向量余弦相似度。體稿件的詞向量的余弦相似度。由于媒體稿件的差異度與相似度是互補關系,最后可按照公式(4)計算

i

ij

iij

i

1 ii

1 i

N(N1)/2

1220233

N

i個稿件組合中兩個詞向量的余弦相似度。

M4

m

Ni1

1

1i

i

i i2

i2

3i3i i4

miiii iii i123

12iiii iii ii

1i2

i3

1i2i3

7.2

ES

S1機器學習模型預測方法已被證明可用于話題敏感程度的計算,可按照模型(6)進行計算。其它符1

1

用于敏感程度預測的機器學習模型,通過人工打標簽的敏感話題數據

S2事件越不穩定。計算平均波動程度應先對采用數據歸一化,將歷史數據轉化為

區間內的數值,可?x

?

x

X)X)X)

DB4401/T

122023k

k

k

k

tt,ttt

t

t

。注1:公式(7)為經典的最大最小歸一化方法,已被證明可用于單位時間波動程度的數據歸一化處理,其它數據2

3

Sigs

e表達式為???

?

的S型歸一化函數已被證明可用平均持續時長的計算,其中?

。其他歸一化函2

tt

S3K

k13

s

k

,1

k

K

ek,1

k

K

?????條件,包括但不限于網絡發帖數超過指定閾值、有粉絲數超過指定閾值的影響力用戶參與。輿情監測主體設?????

S4價值。特殊情況包括但不限于重大突發事件、敏感事件、緊急事件等。專家評分的取值范圍在

7.3

Ea

A

122023

u

Ni1

i1

u

i

A22

212122

222323

2122232

212223

21

22

23

212223

33

3

預測情感極性的概率函數;該函數由輿情監測主體根據分析對象的復雜程度進行選擇,準確率高于

70%三元態度(0—正面,0.5—中立,1—負面)預測方法已被證明是有效

A4DB4401/T

122023價值。特殊情況包括但不限于重大突發事件、敏感事件、緊急事件等。專家評分的取值范圍在

7.4

Ed

D1輿情熱度演化趨勢反映了輿情事件中的發帖量隨時間變化的趨勢,預測準確率達70%以上的模型被為單位,具體根據輿情監測主體需求設定)、發帖數量、和標簽(上升、持續、下降)。將前N天的數據提取預測標簽與人工標注的真實標簽做對比,準確率高于70%則判定模型有效。1

t1,...,tt

1,...,t

1

t1,...,tt

1,...,t

D22

t1,...,

tt

1,...,

t

2

區間內;

t1,...,tt

1,...,t

注2:

其他預測模型經輿情監測主體檢驗后,準確率達到70%以上,同樣可用于網民情感演化趨勢預測,數據類型

122023

8.1

根據第7章中得出的各單項評分結果,通過數據匯總分析,得出自動化系統評價結果。當自動化系8.2

m1 1m1 1

m2 2

m3 3

m4 4

m1

m2

m3

m4m

m1m2

m3m4

分別表示1234四個指標的權重,m1m2m3

m4

s

s11

s2

2

s33s1

s2

s3

s

4s

4

4ss1s2

s3

s4分別表示1234四個指標的權重。s1s2s3

重值由輿情監測主體設定。若輿論強度指標無需專家進行評價,則s4

;若輿論強度指標需專家進

s4

a

a11

a2

2

a33a1

a2

a3

a

4a

44a

a1a2a3a4分別表示

1

2

3

4四個指標的權重。a1a2a3

,具體權重值由輿情監測主體設定。若民意態度指標無需專家進行評價,則a4

;若民意態度指標需專家

a4

DB4401/T

122023

d

d11

d2

2

d1

d2d

d1

d2

分別表示1

2兩個指標的權重,

d1d2

,具體權重值由輿情監測主體設

s

s

a

a

d

d

m

s

a

d

ms

ad

分別表示

m

sa

d

四個指標的權重,msad

8.3

a)

家應從輿評價專家中選用。情評價專庫由輿情測主體負組織與維,更新及

b)

c)

a)

業知識和見解,對輿情時間的媒體傳播、輿論強度、民意態度、輿情演變等維度進行評分,最

b)

9.1

10

0.3)

0.5)

0.7)

1.0]

122023a)

b)

黃色等級(Ⅲ):低風險,若無更大的因素觸發,會慢慢地冷卻。但由于輿情風險項的存在,c)

d)

紅色等級(Ⅰ):高危風險,表示輿論熱度很高、已經形成負面影響的熱點事件,或者是話題9.2

綜合評價得分取值區間為[0,1],根據綜合得分及其對應的事件等級、風險程度規律,確定四個等a)

0.3

b)

0.3

0.5

c)

0.5

0.7

d)

0.7

1.0

表1

11DB4401/T

122023 頻-逆文檔頻率

是一種統計度量,用于)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論