《各平臺數據采集及方法》課件-競品數據采集_第1頁
《各平臺數據采集及方法》課件-競品數據采集_第2頁
《各平臺數據采集及方法》課件-競品數據采集_第3頁
《各平臺數據采集及方法》課件-競品數據采集_第4頁
《各平臺數據采集及方法》課件-競品數據采集_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

競品數據采集競品數據的采集

本實例要求采集“京東”網站上所有標題含有華為、小米的手機信息,需要的字段內容包括標題、價格、關鍵詞、規格參數及頁面網址。競品數據的采集步驟1:新建自定義采集任務

翻頁設置。在自定義采集模式下的瀏覽器窗口中對網頁進行翻頁操作,直至出現“下一頁”按鈕,單擊該按鈕,在“操作提示”面板中單擊“循環點擊下一頁”選項,如圖所示。對網頁進行翻頁操作過程中,系統會自動設置“Ajax超時”選項。步驟2:輸入實例網址并保存網址步驟3競品數據的采集步驟4

詳情頁設置。單擊進入詳情頁設置界面,在瀏覽器窗口中確定商品全部加載完,連續單擊兩個商品標題,確定所有標題均被選中,單擊“操作提示”面板中的“循環點擊每個元素”選項,在上方的流程圖中出現循環框和“點擊元素”模塊。競品數據的采集步驟5

設置品牌篩選。將左側工具欄中的“判斷條件”拖至循環框中的“點擊元素”模塊內,再將“點擊元素”模塊拖至左側判斷框內,單擊選中左側判斷框,使其被虛框包圍。在右側的選項區域中修改執行分支方式為“當前循環項包含文本”,在“包含文本”文本框中輸入華為。競品數據的采集步驟6

提取數據。單擊需要提取的標題,在“操作提示”面板中單擊“采集該元素的文本”選項,可在流程圖中出現“提取數據”模塊,按照同樣的方法分別提取價格、規格參數等信息。單擊“添加特殊字段”按鈕,在下拉列表中選擇“添加固定字段”選項,在輸入框中輸入華為,單擊“確定”按鈕。再次單擊“添加特殊字段”按鈕,選擇“添加當前網頁信息”選項,選擇頁面網址。修改“字段名稱”為標題、價格、關鍵詞、規格參數和頁面網址。競品數據的采集步驟7

增加小米品牌篩選。單擊左側篩選框,使其被虛框包圍,單擊鼠標右鍵,在彈出的快捷菜單中選擇“復制”命令。單擊選擇“判斷條件”模塊,單擊鼠標右鍵,在彈出的快捷菜單中選擇“粘貼”命令,在出現的篩選框上按住鼠標左鍵拖動至“判斷條件”模塊下方正中的位置,最后選中該篩選框,修改右側的“包含文本”為小米。競品數據的采集步驟8

修改提取數據關鍵詞字段名稱。單擊第二個篩選框中的“提取數據”模塊,直至其被虛框包圍,選擇右側的“關鍵詞”字段,直至其變為藍色,單擊下方的“刪除數據字段”按鈕進行刪除,如上圖所示。刪除該字段是為了添加其他關鍵詞。單擊“添加特殊字段”按鈕,選擇“添加固定字段”選項,在輸入框中輸入小米,單擊“確定”按鈕,修改上方“字段名稱”為關鍵詞,因為中間的篩選框篩選條件為小米,所以這里修改關鍵詞為小米,如下圖所示。競品數據的采集步驟9

開始采集。單擊左上方的“開始采集”按鈕,在彈出的“運行任務”對話框中單擊“啟動本地采集”按鈕進行采集。競品數據的采集步驟10

導出數據。數據采集完成后,單擊右下方的“導出數據”按鈕,在彈出的“導出本地數據”對話框中選擇需要的導出方式,然后單擊“確定”按鈕,即可選擇文件存放位置,完成數據導出。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論