5
新手入門 功能點介紹

【流程圖模式】如何設置采集范圍

2020-01-04 19:03:50
瀏覽 15381 次

摘要:本教程為大家介紹如何在流程圖模式中設置采集范圍。 免費下載軟件

不同于智能模式可以直接設置采集范圍,流程圖模式采集范圍的設置比較復雜一些。

1、只設置結束頁面,不設置開始頁面的采集范圍設置

這種設置比較簡單,不管是有分頁按鈕的網頁、瀑布流加載的網頁還是瀑布流+分頁加載的網頁,都只需要選中翻頁循環設置,然后在翻頁次數那里設置自定義次數,用戶想要在哪個頁數停止,就選擇填相應的頁數。

1)分頁按鈕

2)瀑布流分頁

3)瀑布流+分頁按鈕

2、設置開始采集頁面,不設置結束頁面的采集范圍設置

1)網址會隨著頁碼的變動而變動的網站

用戶可以直接復制新的開始采集的網址,在頁面上修改網址。

2)網址不會隨著頁碼的變動而變動的網站

針對這種網站,我們點擊頁面上的分頁按鈕,在操作提示框內選擇點擊“循環點擊該元素”按鈕,此時軟件上會設置一個新的翻頁循環按鈕。

假設之前的任務在第3頁停止,用戶要從第4頁開始采集,則可以在這個翻頁循環上設置自定義翻頁次數“4”。

3)網址不會隨著頁碼的變動而變動,但是頁碼可以通過輸入的方式直接跳轉的網站

有一些網站的網址雖然不會隨著頁碼的變動而變動,但是頁碼部分有輸入框,可以直接輸入頁數跳轉到相應的頁碼,如以下這種網站:

針對這種網站,我們點擊頁面上的輸入框,在跳轉出的操作提示框內輸入想要跳轉的界面,此處用第4頁來舉例,在輸入框內填入數字“4”之后,點擊確定,軟件上會出現一個輸入文字組件。

我們再點擊頁面上“go”按鈕,在跳轉出來的提示操作框上選擇“點擊一次該元素”按鈕,頁面就會跳轉到第4頁去了。

3、設置開始采集頁面及結束頁面的采集范圍設置

這種采集范圍的設置,就是結合以上方法1和方法2的設置,這里不多做贅述。

分享到:
網頁下載成word python數據采集 python爬蟲 網頁內容關鍵字提取 批量生成網址 數據自動整理成excel php爬蟲 批量下載視頻 批量下載圖片 正則匹配郵箱
關閉
我偷偷跟亲妺作爱H,妺妺坐在我腿上下面好湿漫画,第1章厨房春潮-我的妺妺H_主页