




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、bibexcel簡介 福州大學情報學 目錄content1工作界面2概述3數據準備4pajek可視化發展簡史bibexcel是瑞典于默奧大學(umea university)信息研究小組(the information research group,inforsk)歐萊皮爾遜教授設計開發的一款軟件。bibexcel的設計宗旨是輔助用戶分析書目數據,或者格式相近的自然語言文本,最終產生的數據可導出至excel或其他采用【tab】鍵隔開數據的程序中。主要用于文獻計量分析,并可為pajek、netdraw軟件提供繪圖所用數據1概述主要特點 bibexcel是一款供學術非營利使用的免費軟件,其主要特點
2、是小巧實用、功能豐富。運行環境bibexcel.exe軟件可以從bibexcel官方網站(網址:www.umuse/inforsk)上進行下載。其幫助文檔bibexcel.hlp和t也可以在該官方網站上進行下載。在windows運行環境中,將下載后的exe到任意目錄下,雙擊即可運行。在安裝過程中,如果提示需要安裝附加內容,可按照提示在網上下載。主要功能bibexcel軟件主要功能包括文獻計量、引文分析、書目耦合、聚類分析,為pajek、netdraw軟件提供書目數據等。下載崔雷的博客http:/ whole file按鈕,就會在界面右下部分顯示文件內容。文件夾文件文件內容劃分方法欄cr表示參考
3、文獻any表示按;(分號)劃分整個字段jn-表示期刊blank表示按空格劃分整個字段whole表示不進行具體的劃分, 整個字段是一個整體單元。頻數分布欄 后面進行某一字段的具體分析時會用到這個部分 sort表示降序排列 remove表示去重 make表示輸出一個新的gut文件 fractionalize表示用頻率表示具體劃分為很多字段,如所有字段、被引文獻字段、被引作者字段、被引年字段、被引期刊字段等標簽欄 后面產生具體某一字段的out文件時會用到這個部分,也可以在轉換文件格式時產生的doc文件中查看所有的標簽,如ti、au、gd等等。 其中常用的標簽有: ti表示標題, au表示作者, cd
4、表示參考文獻, de表示關鍵詞。文件編輯doc文件編輯out文件增加數據類分析雜項圖譜幫助bibexcej有8個菜單file菜單-文件復制文件重命名刪除文件新建目錄刪除目錄某個文件合并到另一文件將所有被選擇的文件合并到另一文件將列表保存到文件退出edit doc file菜單-編輯doc文件生成新記錄刪除字段識別重復記錄刪除重復記錄刪除指定文字重命名字段標簽將換行符替換成回車符從doc文件中選擇文檔號從out文件中選擇文檔號edit doc-files菜單轉換大小寫創建多個out文件壓縮out文件(每字段一行)轉換以逗號分隔格式的地址壓縮out文件壓縮獨立的空out文件刪除低頻項刪除高頻項從引
5、文中抽取出版年給字符串編號增加分號保留0-9及a-z的字符保留作者首字母保留前n個字符levenshtein距離計算只列出out文件中的實詞等add data classify菜單給out文件添加分類一精確匹配給out文件添加分類一子字符串匹配給out文件添加分類一子字符串匹配給詞頻對文件添加分類利用levenshtein距離添加分類為詞頻文檔號-文檔號添加標簽為文檔號文檔號對添加標簽二進制查找合并兩個文件比較相似字符串將簡寫形式的期刊名與其全名進行匹配將簡寫形式的單詞與其全名進行匹配在字符串中查找某個代碼詞在字符串中查找某個字符串在列表中查找某個單詞analyze菜單增加頻次共現分析doc文
6、件中的引用doc文件及單元格矩陣h指數成對單元格使用mds生成矩陣生成包括零詞對的詞對列表從詞對列表中選擇詞對選擇最強聯系共享單位耦合每記錄的單位詞對的滯后年等 misc菜單-雜項轉換格式解壓csvall格式為diva原始數據解壓標簽格式數據為diva原始數據按issn號進行sherpa romeo檢索按期刊名稱進行sherpa romeo檢索mapping菜單生成net文件生成vec文件生成clu文件從net文件中生成vel文件合并net文件生成地理圖譜help菜單help菜單可以調出bibexcel的幫助文件幫助文件只有在windows 7以下版本的機器上才能打開數據準備“共詞分析法”屬于
7、內容分析法的一種, 主要統計一組詞中兩兩同時出現于一篇文獻的次數,以這種“共現”次數反映這些詞之間的關聯程度,兩個詞的“共詞強度”(指兩個詞同時出現于一篇論文中的次數)越高,則這兩個詞之間的關聯越緊密。操作流程數據轉換(.txt.txt2.doc)字段抽?。?doc.out)共現分析(作者、關鍵詞).coc.ccc.ma2可視化圖譜pajek、netdraw1 數據準備 wos notexpress等文獻管理軟件 導出ne:導出題錄(ris格式) au、de等,不能分析參考咨詢cd字段1 數據準備 cnki2數據轉換-轉換tx2文件操作中如無說明,彈出對話框一律選確定或是2數據轉換-轉換doc
8、文件.doc是bibexcel可處理的格式 創建out文件是我們使用bibexcel軟件進行文獻計量學分析的第一步。當我們創建out文件時,我們首先需要確定使用書目記錄中的哪一個字段來創建out文件,也就是選擇將要分析的字段(標識符) 第一步 在文件管理系統中選擇doc文件; 第二步 在“old tag”文本框中鍵入字段標識符,如au、de等。 第三步 在“select field to be analysed”下拉框中,選擇識別字段內容的操作,如“any;separated field”等。 第四步 點擊“prep”按鈕。就完成了out文件的創建。3字段提取-.doc.out3字段提取-作者
9、字段提取au、ti、de等字段以;隔開點擊第一列文章編號第二列作者名3字段提取-參考文獻字段提取重命名重命名3字段提取-標題字段提取空格切分后的標題詞空格劃分 第一步 在文件管理系統中選擇out文件。 第二步 在“select type of unit”下拉框中,選擇計數單位,如“whole strings”。 第三步 在下方的多選框中,選擇排序方式,如選擇“sort descending”,即按降序排列。 第四步 在下方的多選框中,選擇計算方法,默認的計算方法是“whole counts”,可以改變為“fractional counts”。 第五步 點擊“start”按鈕。將會生成*.cit
10、文件。4共現分析-.out.cit(頻率計算)4共現分析-提取字段按降序排列選whole strings并將序排列降序排列的作者數字是文章數量頻數分布欄:分析作者共現,選擇“author”分析關鍵詞共現,選擇“whole strings”分析機構共現,“whole strings”分析被引期刊共現,“whole strings”分析參考文獻共現,“cite reference” 共現:兩個或者兩個以上標目在同一個字段中出現 第一步 在“select file here”中選中cit文件,點擊“view file”按鈕,在the list中顯示cit文件的內容。 第二步 從cit文件列表中標記將
11、要分析的單元,然后從菜單條中選擇 analyze-co-occurrence-select units via listbox 第三步 在“select file here”標記out文件。注意:不要在the list中顯示out文件。 第四步 從菜單中選擇 analyze-co-occurrence-make pairs via listbox4標題詞共現分析-.cit.coc選頻次10次以上共現標題詞按頻次降序排列生成coc文件4作者共現coc文件5共現矩陣構建-.coc.ccc數字代表該詞在.coc文件中出現的次數生成ccc文件5共現矩陣構建-.ccc.ma2選中*.coc打開*.ccc
12、5共現矩陣構建-.ccc.ma2標題詞共現的三角矩陣,可粘貼至excel繼續可視化5作者共現全矩陣 創建供pajek軟件使用的文件 文件有三種類型:net、vec和clu6導出數據 創建net文件 第一步 選擇*.coc文件。 第二步 從菜單條中選擇 mapping-create net-file for pajek.6導出數據6導出數據.net6導出數據 創建vec文件 第一步 選擇*.cit文件。 第二步 從菜單條中選擇 mapping-create vec-file 6導出數據.vec4pajek可視化4pajek可視化4pajek可視化4示例總結 txt文件文件:從從wos中導出的數據文件中導出的數據文件; tx2文件文件:轉換轉換txt文件格式第一步生成的文件文件格式第一步生成的文件; doc文件文件:生成的生成的bibexcel可處理的文件格式可處理的文件格式; out文件文件:抽取只抽取只包含需要分析的記錄所生成的的文件包含需要分析的記錄所生成的的文件; oux文件文件:對對out文件中記錄去重后產生的新的文件文件中記錄去重后產生的新的文件; cit文件文件:對對out或或oux文件內容按頻數或者頻率次序排列的文件文
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年貿易合同 煙草定購合同
- 船舶智能制造技術與設備考核試卷
- 遙感技術在城市土地利用變化監測中的應用考核試卷
- 船舶修理合同履行與爭議解決考核試卷
- 特種物品物流運輸賠償補充協議
- 橋梁工程承臺基礎施工進度調整合同
- 演員參與綜藝節目合同補充條款
- 繼承房產瑕疵鑒定與整改責任協議書
- 2025年中國保溫防火板行業市場前景預測及投資價值評估分析報告
- 網絡安全協議翻譯與完善補充合同
- DB4211T12-2022醫療廢物暫存間衛生管理規范
- 第二講公文語言及結構(1語言)分析課件
- 氯氧鉍光催化劑的晶體結構
- 低壓電氣裝置的設計安裝和檢驗第三版
- 國際商務管理超星爾雅滿分答案
- 監理人員考勤表
- 克麗緹娜直銷獎金制度
- 基本醫療保險參保人員丟失醫療費用票據補支申請
- 高血壓病人的護理(PPT)
- DB11-T 825-2021綠色建筑評價標準
- 4例先天性高胰島素血癥患兒的護理
評論
0/150
提交評論