如何采集58同城上面信息?采集教程每一家公司中都會有專門的招聘專員,作為一名優(yōu)秀的招聘專員,就一定要學(xué)會如何在58同城上采集一些有價值的招聘信息�,F(xiàn)在就讓西西小編教教你如何正確的采集寶貴的信息吧!
步驟:
首先需要找好專門的采集軟件,今天西西小編主要用的是熊貓采集軟件。需要到官網(wǎng)下載這個軟件。
然后打開我們這次采集需要的工具熊貓采集軟件,點擊新建項目(標(biāo)準(zhǔn))。
隨便輸入一個項目名稱,或者不輸入也是可以的,系統(tǒng)默認(rèn)會給你命名一個文件名,這里因為我是準(zhǔn)備采集58二手房上面的電話號碼的信息 我就起了一個我需要的名稱。
然后點擊下一步。
進入標(biāo)題列表頁及其翻頁設(shè)置,列表頁是包含我們要采集內(nèi)容的鏈接網(wǎng)址的頁面,比如百度搜索一個關(guān)鍵詞,會列出來很多網(wǎng)頁,這些網(wǎng)頁我們就可以認(rèn)為是標(biāo)題列表頁面。在58上面找到我們要采集的標(biāo)題列表頁。
將頁面的網(wǎng)址拷貝到我們的熊貓軟件中。
點擊開始分析。
如果我們需要翻頁采集,那么選擇是即可,不要則選擇否即可。我這里沒有設(shè)置翻頁采集,我選擇的是否,當(dāng)然這個根據(jù)實際情況來決定。
點擊下一步設(shè)置,進入選擇內(nèi)容頁的設(shè)置,隨便選擇一個我們要采集的鏈接,會發(fā)現(xiàn)右邊我們要采集的鏈接全部被紅框框選起來了。那么這里我們就不要進行調(diào)整,直接再次下一步設(shè)置。
來到內(nèi)容頁面模板管理,直接點擊添加新模板,會把我們在上一步選中的鏈接作為模板,這地方也可以自己選擇一個模板,然后把網(wǎng)址粘貼到添加新模板按鈕左邊的文本框里,點擊添加新模板。
點擊添加新模板之后會彈出一個設(shè)置模板的新窗口。點擊軟件上方的開始分析,稍等片刻之后軟件會詢問你是否需要軟件自動提取標(biāo)題正文,一般情況下我們在這里都會選擇否,如果你是采集新聞類的內(nèi)容,那么你也可以選擇是。
之后我們會發(fā)現(xiàn)左邊款里面會出現(xiàn)很多我們在網(wǎng)頁中能看見的內(nèi)容,這個時候我們需要什么就勾選上采集該項即可。
這個時候我們會發(fā)現(xiàn),上面模板如果是我們是用的個人二手房源的話,那么我在左邊是看不到電話號碼的信息的,看到的只會是一張圖片,這個時候我們只需要稍微做點手腳就可以采集圖片上面的電話號碼了。像58同城這種網(wǎng)站,我們會發(fā)現(xiàn)在wap上面訪問這個內(nèi)容時,看到的電話號碼就是數(shù)字了。那么我們只需要知道wap訪問的時候是什么網(wǎng)址就可以了。
勾選上之后,輸入我們的中介規(guī)則。
然后然后替換到網(wǎng)址,組合一下就會出現(xiàn)我們要采集的那個手機訪問出來的頁面地址。
點擊添加按鈕之后,勾選上該鏈接為指向下級子頁面的鏈接,點擊分析鏈接指向的頁面,然后進入到我們下級子頁面。
在子頁面里面我們開始設(shè)置,點開始分析按鈕。
這個時候我們再去采集我們要采集的電話號碼會發(fā)現(xiàn)已經(jīng)變成數(shù)字了,不在是一張圖片了。
然后再里面尋找自己想要的信息就可以了。