網絡搜索數據與GDP相關性分析_第1頁
網絡搜索數據與GDP相關性分析_第2頁
網絡搜索數據與GDP相關性分析_第3頁
網絡搜索數據與GDP相關性分析_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、網絡搜索數據與GDP相關性分析網絡搜索數據與GDP相關性分析1引言根據2022年1月中國互聯網絡信息中心NNI公布的?2022年中國網民搜索行為研究報告?指出:2022年,國內搜索行業呈現多元化的開展趨勢,新進入的搜索引擎和現有搜索競爭較為劇烈,不斷細分的搜索市場和性能持續提升的終端設備正改變著用戶的搜索習慣。綜合搜索仍然是最根本的搜索工具,過去半年,搜索網民使用過的綜合搜索網站的比例達98.0%,此外,通過購物網站、視頻網站、微博進展過搜索的網民比例也在50%以上。NNI每半年對網民數量進展統計,結果顯示,截止2022年6月30日,我國網民數量到達6.32億,接近總人口的50%。從中國互聯網

2、絡信息中心2022年出版的?第33次中國互聯網絡開展狀況統計報告?可以得到,我國網民年齡構造中,10-59歲的階段占據了總人口的絕大部分,這部分人群不僅是網絡的常客,也是社會經濟開展的主力軍,他們擁有很強的消費才能及消費才能,因此通過網絡搜索數據討論網民的消費活動,研究其消費方式及主要消費內容,通過產品形態來驗證網絡搜索數據行為與GDP的相關性分析是具有現實意義的。2概念框架的構建本文主要把消費者消費及居民消費過程劃分為需求、信息搜尋、決策三個過程,消費者有投資需求之后,通過網絡搜索投資相關信息,對其消費決策將產生一定的影響,同樣地,消費者有消費需求之后,通過網絡搜索消費相關關鍵詞,可以對其消

3、費決策產生一定的影響,然而消費和消費影響市場價格,消費者與消費者也可通過網絡搜索信息來理解當期市場價格。總的來講,不管是消費還是消費,不管是市場價格體系還是宏觀經濟體系,均與網絡搜索有很強的相關性,因此通過網絡搜索關鍵詞,分析關鍵詞的指數變化與GDP的變化是否具有相關關系是具有一定的理論根底的。3研究方法及流程主要對網絡搜索數據與我國GDP的相關性進展研究,通過用戶運用搜索引擎搜索相關關鍵詞這一方式,來分析其可以對國家GDP產生什么樣的影響。簡單來講,研究過程為:數據獲娶數據處理、數據分析三方面。一數據獲取獲取數據是分析的根底,數據獲取首先要選用搜索引擎,縱觀全球,運用最多的引擎是谷歌,但在我

4、國,由于網絡限制的影響,用戶運用最多的是百度引擎,因此運用百度搜索數據來對GDP的趨勢進展預測是更符合實際的。本文由論文聯盟搜集整理第二,獲取數據需要對關鍵詞初選并進展挖掘。根據GDP的定義、作用、影響因素等,運用Gglerrelate關鍵詞挖掘工具和SE關鍵字挖掘工具以及ITLAS漢語分詞系統三者結合選出與GDP相關系數最大的關鍵詞,本文共初選關鍵詞33個。第三,關鍵詞指標獲齲將第二步獲取的33個關鍵詞導入百度指數,搜索2022年初至2022年末的關鍵詞月度指標共48組。第四,GDP季度數據獲齲在國家統計局公布的歷年數據中,查找2022年初至2022年末的我國GDP季度數據共16組。二數據處

5、理由于國家統計局公布的GDP數據最小單位為季度數據,并且是相對數據,因此需要將前期獲取的48組關鍵詞月度數據數據轉化為季度數據,而且百度指數上的關鍵詞指標是絕對指標,所以還需將關鍵詞數據轉化為相對指標,才可以與GDP數據進展分析。三數據分析由于GDP數據具有很強的時間性,因此運用Evies對GDP及關鍵詞數據進展時間序列分析,但假設將所選中的33個關鍵詞全部導入作為變量,可能會很復雜,因此運用SPSS軟件先對關鍵詞數據進展主成分分析,提取出具有代表性的幾個主成分,再與GDP進展相關性分析。4網絡搜索數據與GDP相關性實證分析一關鍵詞選取與預處理不同的網絡搜索關鍵詞在網絡上會有不同的關鍵詞信息,

6、但選取關鍵詞不能僅僅靠平時的經歷和熟悉程度,而要選擇科學的取詞方法來進展關鍵詞挑眩前文已經提到,選取關鍵詞采用Gglerrelate關鍵詞挖掘工具、SE關鍵字挖掘工具和ITLAS漢語分詞系統三者結合來進展關鍵詞挖掘,從宏觀方面選擇了經濟開展形勢、企業投資、勞動報酬、就業率等關鍵詞,根據以上宏觀因素,再利用百度指數關鍵詞推薦功能,選擇與影響我國GDP的宏觀因素相關的關鍵詞共有1300多個,剔除重復及數據量較少的關鍵詞,組成初始關鍵詞組,共有101個。將初始關鍵詞組逐個導入百度指數之中,剔除百度指數中沒有收錄而且每月搜索指數較低的關鍵詞,最終選取了33個關鍵詞來進展分析。二網絡搜索綜合指數和季節調

7、整及標準化之后的GDP數據的協整性1.序時圖判斷平穩性,對兩組數據做序時圖,發現兩者均存在明顯的線性趨勢,需進展單整檢驗。2.對兩組數據進展單整檢驗,首先分別對GDP數據與X數據進展ADF檢驗,發現,兩者都是一階單整。3.JhansenintegratinTest檢驗兩者是否存在協整關系,結果發現不能回絕存在一個協整關系,詳細見下表:三網絡搜索綜合指數和季節調整及標準化之后的GDP數據的Granger因果檢驗經歷證GDP與X存在協整關系,對兩者做格蘭杰因果檢驗,發現XdesntGrangerauseGDP的概率為0.037,GDPdesntGrangerauseX的概率為0.9269說明網絡搜

8、索綜合指數X是季節調整及標準化之后的GDP數據的Granger原因,對GDP預測有幫助。5結論與缺乏之處本文先從理論上分析網絡搜索數據與GDP開展的相關性,進一步分析網絡搜索數據與GDP開展具有一樣的增長趨勢,再通過實證分析對其相關性進展驗證,并且做了Granger因果關系檢驗,得到的相關結論如下:1對GDP的分析基于居民消費為中心展開,消費者消費及消費者消費在互聯網上均有表達,消費者有消費需求,就會通過互聯網搜索相關信息,消費者有消費需求,也會通過互聯網理解消費渠道,消費品相等相關信息,以上變化在互聯網上表現為閱讀指數的變化,在商品市場中那么表現為GDP、PI等指標的變化,兩者的變化都是對同

9、一事物的反映,因此兩者具有一定的相關關系。2實證分析結果說明:網絡搜索數據與GDP之間存在長期穩定的協整關系。3Ganger因果檢驗的結果說明網絡搜索綜合指數X是季節調整及標準化之后的GDP數據的Granger原因,對GDP預測有幫助。總的來講,用網絡搜索數據與GDP來進展相關性分析還存在一些問題,有待進一步改善。首先,本文選擇百度引擎來做相關分析是因為我國運用百度引擎的用戶占大多數,但是百度指數的相關數據是由2022年開始做記錄的,從2022年第一季度到2022年第四季度僅有16組數據,所可以搜集的數據量較少,如今2022年第一季度才剛剛過去,因此模型預測僅有2022年第一季度作為對照,可以驗證模型的數據較少,谷歌趨勢上的數據從2022年開始,但就我國來講,運用谷歌引擎來進展搜索的用戶僅有極少部分,因此用谷歌數據來進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論