5
新手入門 功能點介紹

【智能模式】基本操作流程

2021-08-09 14:29:38
瀏覽 47394 次

摘要:本教程主要給大家介紹一下智能模式的基本操作流程。 免費下載軟件

如果您已經看完了后羿采集器智能模式的第一個采集案例,想必您對其已經有了初步的了解,這里我們再來詳細介紹一下智能模式的基本操作流程。

1、輸入正確的網址

輸入了正確的網址,這個采集任務就成功了一半。

后羿采集器支持單網址和多網址采集,支持從本地TXT文件中導入網址,也支持參數網址批量生成。

更多詳情內容,請參考以下教程:

如何創建智能模式任務

2、選擇頁面類型及設置分頁

在智能模式下,后羿采集器會自動識別網頁,如果出現識別不準確的情況,此時您可以先手動自動識別一下,如果手動自動識別還不起效果,您可以手動點選列表,從而輔助軟件識別出正確的結果。

更多詳情內容,請參考以下教程:

如何設置頁面類型

如何設置分頁

關于上文提到的頁面類型,您可以分別點擊下面的鏈接了解具體的信息:

單頁類型

※?列表頁類型

列表頁+詳情頁類型

列表頁+詳情頁需要點擊操作的類型

3、預登錄

在編輯任務過程中,我們有時候會遇到需要登錄才能查看內容的網頁,這時我們需要用到預登錄功能,登錄成功之后就能進行正常的數據采集。

更多詳情內容,請參考以下教程:

如何采集需要登錄才能查看的網頁

4、預執行操作

在編輯任務過程中,如果用戶需要進行點擊操作,可以使用預執行操作來滿足用戶需求。

更多詳情內容,請參考以下教程:

如何設置預執行操作

5、輸入驗證碼

在編輯任務過程中,如果用戶遇到驗證碼,可以點擊右上角的驗證碼輸入功能,進行手動輸入操作。

更多詳情內容,請參考以下教程:

編輯任務時遇到驗證碼怎么處理

6、切換代理

在編輯任務過程中,如果用戶遇到頁面無法顯示或驗證碼提示,也可以點擊右上角的切換代理功能,進行操作。

更多詳情內容,請參考以下教程:

如何在編輯任務時切換代理

7、網絡安全設置

在編輯任務過程中,用戶如果遇到網頁異常的時候可以試著使用此功能,但是要注意打開此選項可能導致頁面上的某些內容無法采集(如iframe中的內容)。

8、切換瀏覽器模式

在編輯任務過程中,可以使用不同的瀏覽器模式來優化采集效果,具體使用場景需要根據實際情況來判斷。

更多詳情內容,請參考以下教程:

切換瀏覽器模式有什么作用

9、設置提取字段

智能模式下,軟件會自動識別網頁中的數據并展示到采集結果預覽窗口,用戶可以根據自己的需求對字段進行設置。

更多詳情內容,請參考以下教程:

如何對采集字段進行配置

10、深入采集

如果用戶需要采集詳情頁的信息,可以點擊左上角的深入采集按鈕,或者直接點擊某一條鏈接,從而打開詳情頁,采集詳情頁的數據。

更多詳情內容,請參考以下教程:

如何設置深入采集

11、設置數據篩選/采集范圍

在編輯任務的過程中,用戶如果需要設置一些篩選條件或者設置采集范圍,可以點擊頁面上相對應的按鈕進行功能設置。

更多詳情內容,請參考以下教程:

如何進行數據篩選

如何設置采集范圍

12、采集任務的設置

在啟動采集任務之前,我們需要對采集任務進行配置,包括定時啟動、智能策略、自動導出、文件下載、加速引擎、數據去重及開發者設置。

更多詳情內容,請參考以下教程:

如何配置采集任務

13、運行數據界面

啟動任務之后會跳轉到數據運行界面,在這個界面上用戶可以看到數據采集情況。

更多詳情內容,請參考以下教程:

任務運行界面介紹

14、查看采集結果及導出數據

在采集任務結束之后,用戶可以查看采集結果并導出數據。

更多詳情內容,請參考以下教程:

如何導出采集結果

分享到:
數據自動整理成excel python爬蟲 批量下載視頻 網頁內容關鍵字提取 python數據采集 批量生成網址 正則匹配郵箱 php爬蟲 網頁下載成word 批量下載圖片
關閉
我偷偷跟亲妺作爱H,妺妺坐在我腿上下面好湿漫画,第1章厨房春潮-我的妺妺H_主页