本文介紹使用八爪魚7.0采集鏈家房源數據的方法以深圳出租房為例

?

采集網站:

https://sz.lianjia.com/zufang/

?

使用功能點:

l?分頁列表頁信息采集

?

鏈家網:鏈家是一家集房產交易服務、資產管理服務為一體以數據驅動的價值鏈房產服務平臺,業務覆蓋二手房交易、新房交易、租賃、裝修服務等。鏈家目前已覆蓋北京、上海、廣州、深圳、天津、成都、青島、重慶、大連、合肥等28個地區,全國門店數量約8000家,旗下經紀人超過13萬名。為不斷提高購房服務體驗,鏈家積極布局線上平臺。

?

鏈家租房信息采集數據說明:本文進行了鏈家網-租房信息的采集。本文僅以“鏈家網-租房信息采集”為例,大家在實操過程中,可根據自身需求,更換鏈家網的其他內容進行數據采集。


鏈接網采集字段詳細說明:房源信息標題,房源小區信息,房屋面積,房屋戶型,房屋朝向,房屋樓層,房屋事件年份,房屋特性。

?

步驟1:創建采集任務

進入主界面選擇,選擇自定義模式

1?

上面網址的網址復制粘貼到網站輸入框中,點擊保存網址

2?

保存網址后,頁面將在八爪魚采集器中打開,紅色方框中的列表內容,就是本次演示要采集的數據

3?

?

步驟2:創建翻頁循環

l?找到翻頁按鈕,設置翻頁循環

將頁面下拉到底部,找到下一頁按鈕,鼠標點擊,在右側操作提示框中,

選擇循環點擊下一頁

4?

?

步驟3:房源信息采集

l?選中需要采集的字段信息,創建采集列表

l?編輯采集字段名稱

?

如圖,移動鼠標選中列表中標題的名稱,右鍵點擊,需采集的內容會變成綠色

5?

注意:點擊右上角的流程按鈕即可展現出可視化流程圖。

?

移動鼠標選中紅色方框任意文本字段后,列表中所有適配內容會變成綠色,在右側操作提示框中,查看提取的字段,可以將不需要的字段刪除,然后點擊“選中全部”

6?

注意:?鼠標放在該字段上會出現一個刪除標識,點擊即可刪除該字段。

7?

?

點擊“采集以下數據”

8?

修改采集字段名稱,點擊下方紅色方框中的保存并開始采集

9?

?

根據采集的情況選擇合適的采集方式,這里選擇啟動本地采集

10?

說明:本地采集占用當前電腦資源進行采集,如果存在采集時間要求或當前電腦無法長時間進行采集可以使用云采集功能,云采集在網絡中進行采集,無需當前電腦支持,電腦可以關機,可以設置多個云節點分攤任務,10個節點相當于10臺電腦分配任務幫你采集,采集時間降低為原來的十分之一;采集到的數據可以在云上保存三個月,可以隨時進行導出操作。

?

步驟4:數據采集及導出

采集完成后,會跳出提示,選擇導出數據

12?

?

選擇合適的導出方式,將采集好的數據導出

13?

?

?

?