【智能模式】基本操作流程
摘要:本教程主要給大家介紹一下智能模式的基本操作流程。 免費下載軟件
如果您已經看完了后羿采集器智能模式的第一個采集案例,想必您對其已經有了初步的了解,這里我們再來詳細介紹一下智能模式的基本操作流程。
1、輸入正確的網址
輸入了正確的網址,這個采集任務就成功了一半。
后羿采集器支持單網址和多網址采集,支持從本地TXT文件中導入網址,也支持參數網址批量生成。
更多詳情內容,請參考以下教程:
2、選擇頁面類型及設置分頁
在智能模式下,后羿采集器會自動識別網頁,如果出現識別不準確的情況,此時您可以先手動自動識別一下,如果手動自動識別還不起效果,您可以手動點選列表,從而輔助軟件識別出正確的結果。
更多詳情內容,請參考以下教程:
關于上文提到的頁面類型,您可以分別點擊下面的鏈接了解具體的信息:
※ 單頁類型
※?列表頁類型
3、預登錄
在編輯任務過程中,我們有時候會遇到需要登錄才能查看內容的網頁,這時我們需要用到預登錄功能,登錄成功之后就能進行正常的數據采集。
更多詳情內容,請參考以下教程:
4、預執行操作
在編輯任務過程中,如果用戶需要進行點擊操作,可以使用預執行操作來滿足用戶需求。
更多詳情內容,請參考以下教程:
5、輸入驗證碼
在編輯任務過程中,如果用戶遇到驗證碼,可以點擊右上角的驗證碼輸入功能,進行手動輸入操作。
更多詳情內容,請參考以下教程:
6、切換代理
在編輯任務過程中,如果用戶遇到頁面無法顯示或驗證碼提示,也可以點擊右上角的切換代理功能,進行操作。
更多詳情內容,請參考以下教程:
7、網絡安全設置
在編輯任務過程中,用戶如果遇到網頁異常的時候可以試著使用此功能,但是要注意打開此選項可能導致頁面上的某些內容無法采集(如iframe中的內容)。
8、切換瀏覽器模式
在編輯任務過程中,可以使用不同的瀏覽器模式來優化采集效果,具體使用場景需要根據實際情況來判斷。
更多詳情內容,請參考以下教程:
9、設置提取字段
智能模式下,軟件會自動識別網頁中的數據并展示到采集結果預覽窗口,用戶可以根據自己的需求對字段進行設置。
更多詳情內容,請參考以下教程:
10、深入采集
如果用戶需要采集詳情頁的信息,可以點擊左上角的深入采集按鈕,或者直接點擊某一條鏈接,從而打開詳情頁,采集詳情頁的數據。
更多詳情內容,請參考以下教程:
11、設置數據篩選/采集范圍
在編輯任務的過程中,用戶如果需要設置一些篩選條件或者設置采集范圍,可以點擊頁面上相對應的按鈕進行功能設置。
更多詳情內容,請參考以下教程:
12、采集任務的設置
在啟動采集任務之前,我們需要對采集任務進行配置,包括定時啟動、智能策略、自動導出、文件下載、加速引擎、數據去重及開發者設置。
更多詳情內容,請參考以下教程:
13、運行數據界面
啟動任務之后會跳轉到數據運行界面,在這個界面上用戶可以看到數據采集情況。
更多詳情內容,請參考以下教程:
14、查看采集結果及導出數據
在采集任務結束之后,用戶可以查看采集結果并導出數據。
更多詳情內容,請參考以下教程: