如何利用python爬取數據並保存為word文檔

如何利用python爬取數據並保存為word文檔?請看下面的經驗吧!

方法/步驟

在做爬取數據之前,你需要下載安裝兩個東西,一個是urllib,另外一個是python-docx。

然後在python的編輯器中輸入import選項,提供這兩個庫的服務

urllib主要負責抓取網頁的數據,單純的抓取網頁數據其實很簡單,輸入如圖所示的命令,後面帶連結即可。

抓取下來了,還不算,必須要進行讀取,否則無效。

接下來就是抓碼了,不轉碼是完成不了保存的,將讀取的函數read轉碼。再隨便標記一個比如XA。

最後再輸入三句,第一句的意思是新建一個空白的word文檔。

第二句的意思是在文檔中添加正文段落,將變量XA抓取下來的東西導進去。

第三句的意思是保存文檔docx,名字在括號裡面。

這個爬下來的是原始碼,如果還需要篩選的話需要自己去添加各種正則表達式。

注意事項

覺得有用的話投個票、點個讚吧!謝謝!

本文內容整理自網絡, 文中所有觀點看法不代表淘大白的立場