很多用戶在制作規則的時候,可能會遇到總是在一二頁循環提取數據,而不會轉到第三頁的情況,這其實是由于Xpath定位不好導致的,我們需要通過修改Xpath來解決這個翻頁問題。


在出現這個問題的時候,我們可以直接在流程里面找到問題所在,下面的規則是直接按照新手入門的步驟做的。


一?

如上圖,在點擊循環的時候可以看到循環的是下一頁按鈕,我們可以直接在流程里選擇點擊翻頁,這時八爪魚下面的瀏覽器會直接跳到第二頁:


二?

這個時候我們再點擊流程圖里面的循環,可以看到循環列表已經變成了上一頁,這樣系統再點擊翻頁的時候就會直接跳回第一頁,提取第一頁的數據,如此一直重復循環:

?三


在循環里面的高級選項下方,可以看到下一頁的XPath如下圖所示:


四?

我們把這個XPath復制到火狐里面去,發現在第一頁是的確可以定位下一頁的,但是在第二頁就變了,可以看到這個XPath在火狐里面上一頁和下一頁都定位了,因為八爪魚自動識別的都是當前頁面的XPath,系統沒有翻到第二頁不知道第二頁的情況,所以我們翻頁的XPath只有在第一頁里面是正常的:

?五


再看一下火狐瀏覽器里面的源碼,在第二頁里面這個XPath對應的不正確,直接把上一頁和下一頁都對應到了,所以我們需要通過修改XPath來正確定位下一頁:

六


手動在火狐里面直接寫,可以看到這個網頁的下一頁特點的,我們直接可以用text()函數,前面在XPath入門2里面給大家介紹過這個函數的意思,是一個文本函數,直接可以定位源碼里面包含的文本,在火狐里面寫成//A[text()='下一頁']即可,然后將這條XPath再復制到八爪魚里面。


七?

?