使用簡數採集平台抓取網頁數據

簡數採集平台特點:

--採集不需安裝任何客戶端,在線可視化點選;

--集成智能提取引擎(國內獨家),自動識別數據和規則,甚至不需修改即可開始採集;

--圖片下載支持存儲到:阿里雲OSS、七牛雲、騰訊雲;(支持水印、壓縮等)

--全自動化:定時採集+自動發布;

--提供翻譯、簡繁體轉換、同義詞替換等SEO操作;

--免費、自動接入多家IP代理服務商等。

--與WordPress、織夢Dede、Zblog等系統無縫結合,點幾下就可發布到這些CMS。

工具/原料

電腦端瀏覽器,例如chrome,firefox等

方法/步驟

首先打開簡數官網:http://www.keydatas.com/

註冊帳號並登錄

登錄後,點擊控制台進入採集頁面;

點擊創建採集任務,就會彈出智能嚮導模式界面,

填上想要採集的入口網址即可點下一步;

列表頁設置

接下來列表頁系統會智能化選擇詳情頁連結;

如果採集不是想要的連結,可進入列表提取器修改,在可視化的頁面用滑鼠左鍵點擊選擇想要採集的連結,當選擇兩個連結時系統會自動選擇該網站其他類似連結,完成後記得點擊保存;

PS:綠色框代表已選擇該連結;

詳情頁設置

下一步是詳情頁的配置環節,系統同樣會智能化獲取相關信息;

如果採集不是想要的內容,可進入詳情頁提取器修改相關欄位(如標題,內容,作者,發布日期,標籤等),同樣是可視化點擊選擇想要的內容,完成後記得保存;

數據採集

點擊啟動運行採集,待採集完成;

創建發布目標(以發布到WordPress為例)

在採集任務管理頁面,找到「發布目標管理」 ==》點擊按鈕「添加發布目標-Wordpress」;

在「設置對應欄位」頁面系統會先做智能匹配,如果任務的詳情提取器採用的是系統默認欄位,那麼這裡可以不用做任何改動。發布時,系統會根據這裡已設置的對應關係把採集到的數據內容發送給wordpress對應欄位。

PS:各CMS系統要先安裝對應的簡數插件;

數據發布

在任務管理頁面,找到選項卡「結果數據&發布「,在數據列表選中一條或多條數據,點擊上面的「數據發布」按鈕,選擇剛剛配置的發布目標wordpress,待發布完成;

到這採集就完成,十分簡單,方便,快捷

相關文章

  1. 簡數採集平台抓取網頁數據-教程

    本文介紹如何使用簡數採集平台抓取網頁數據,內容偏向基礎部分: 簡數採集平台是一個在線配置和雲採集的網頁數據採集和發布平台,無需安裝客戶端. 工具/原料 瀏覽器 方法/步驟 首先搜尋簡數數據採集平台,進 ...
  2. 使用八爪魚採集器抓取網頁數據

    php抓取網頁內容比較常用的是藉助第三方類編寫抓取代碼,其中QueryList是一個基於phpQuery的通用列表採集類,是一個簡單. 靈活.強大的採集工具,也比較常用,但是對於一些不用代碼想要抓取網 ...
  3. 建站之路028火車頭採集器抓取網頁文章

    火車頭採集器是一款網頁數據採集器,它可以快速的對網頁上數據信息進行規範性的採集,包括圖片,文字,表格,連結,手機,郵箱等.實現準確高效的實時抓取數據 擁有強大的採集功能,能夠採集那些需要登陸才能查看的 ...
  4. 如何用簡數採集平台採集小說

    本文介紹如何用'簡數數據採集平台'採集小說 工具/原料 瀏覽器 方法/步驟 搜尋想要採集的小說,進入章節目錄頁: 打開簡數數據採集平台網頁,登錄進入控制台(沒帳號自己註冊),點擊創建採集任務,輸入相關 ...
  5. 如何用簡數採集平台採集二手車網站

    本文介紹如何用'簡數數據採集平台'採集二手車網站. 數據採集平台是一個完全在線配置和雲端採集的網頁數據採集和發布平台,功能強大,操作簡單,不僅提供網頁內容採集.數據加工處理.SEO工具和發布等數據採集 ...
  6. Excel如何抓取網頁數據之JSON數據抓取

    Excel 2013以後的版本提供了WEBSERVICE和FILTERXML函數可用於網頁數據抓取,但只能抓取XML格式的數據.而現在很多網站的網頁或接口返回的都是HTML或JSON數據,那麼如何精確 ...
  7. js如何抓取網頁數據

    js如何抓取網頁數據?下面我們來看看吧. 工具/原料 pc 方法/步驟 首先在根節點document中監聽所有需要抓取的事件. 在元素事件傳遞中,捕獲階段獲取事件信息,進行埋點. 通過getBound ...
  8. 如何用python抓取網頁數據

    可能很多小夥伴們不是很清楚如何用python抓取網頁數據,那麼具體應該怎麼做呢?感興趣的小夥伴們隨小編一起看看吧! 方法/步驟 在抓取網站中有兩個基本的任務: 加載網頁到一個 string 里. 從網 ...
  9. vba如何抓取網頁數據

    vba如何抓取網頁數據 工具/原料 vba 方法/步驟 1.實現把單元格內容清空的代碼如下 2.定義網址的代碼如下 3.實現創建對象HTML的方法代碼 4.發送請求和等待請求的方法代碼 5.實現定義數 ...
  10. PHP抓取網頁failed to open stream解決方案

    本教程完美解決PHP抓取網頁failed to open stream: HTTP request failed!遇到的問題. 工具/原料 PHP一系列軟體 電腦一台 方法/步驟 如圖所示:抓取失敗了 ...
  11. 搜尋引擎抓取網頁原理學習筆記

    做正規seo技術必會的搜尋引擎抓取網頁原理應該是很複雜的.可以寫洋洋灑灑的長篇論文.這裡就將我自己學習到的網頁抓取原理記錄一下.筆記應該不夠完整隻將重要過程做個介紹 步驟/方法 做正規seo技術必會的 ...
  12. 怎麼用Java程序抓取網頁原始碼?

    怎麼用java程序抓取網頁原始碼?如果抓取代碼都用程序來做的話,相信要快很多.程序如下:       import java.io.BufferedReader;import java.io.IOEx ...
  13. 一次抓取網頁中所有圖片

    一次抓取網頁中所有圖片 我們上網找素材的時候,經常會遇到一些網頁裡面用了很多自己能夠用到的圖片,但是每一個都要單擊右鍵,然後圖片另存為,很是麻煩.其實藉助SnagIt抓圖軟體可以一次抓取網頁內所有圖片 ...
  14. 百度平台抓取診斷工具一直抓取中的解決方法

        百度平台最新推出的抓取診斷工具是可以讓站長從百度蜘蛛的視角查看抓取內容,自助診斷百度蜘蛛看到的內容,和預期是否一致.每個站點每月可使用300次,抓取結果只展現百度蜘蛛可見的前200KB內容. ...
  15. 如何java寫/實現網絡爬蟲抓取網頁

    很多時候我們需要一些數據或者信息,而這些信息可能是收費的,不公開的,也可能是信息量比較大,如果單純靠我們手工來做的話可能比較浪費時間,所以我們需要寫一個網絡爬蟲,高效地將自己需要的信息抓取下來,在這裡 ...
  16. 小樂圖客攻略:[16]如何抓取網頁CSS背景圖

    我們知道在網頁取圖時,經常遇到一些使用小樂圖客取不到的圖.這時就需要考慮這些圖片是否屬於CSS背景圖,實際圖片地址是否隱藏在CSS文件中.本文分享給大家如何批量從網站CSS文件中抓取背景圖的方法. 工 ...
  17. 搜尋引擎抓取網頁的方法

    愈來愈多的站長加入到了seo的行列之中,新站長需要知道很多的基礎知識,才能開始優化之旅,有很多半罐子的理論有時會誤導你,網站優化給新手站長推薦Google給網站管理員的網站站長指南.這是一本簡潔的精確 ...
  18. 抓取網頁指定內容(資料),獲取網頁里的圖片

    最近有遇到同學反饋,網頁里的那些沒有特徵值的文本元素不知道怎麼獲取.以及,不知道怎麼獲取保存網頁里出現的圖片. 工具/原料 按鍵精靈2014 方法/步驟 獲取網頁指定文字: 目前按鍵支持的元素特徵值有 ...
  19. 如何抓取網頁或考試軟體中不能複製的文字

    一些網頁或軟體中的文字被限制,不能複製.而我們卻需要把這些文字複製出來,那麼怎麼才能把這些被限制的文字複製出來呢,下面我給您分享一個好方法:那就是利用圖片文字抓取工具軟體把這些被限制的文字提取出來.這 ...
  20. 如何抓取網頁製作製作 mdx 格式詞典

    一個簡單得不能再簡單的網頁抓取然後製作mdx教程 工具/原料 作業系統:Windows 7 旗艦版64位 抓取工具:wget 文本處理:EditPlus, UltraEdit, TextForever ...