數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版) | 誠品線上

數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版)

作者 零一/ 韓要賓/ 黃園園
出版社 深石數位科技股份有限公司
商品描述 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版):本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本

內容簡介

內容簡介 本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本書簡化了Python基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容,至於對Python基礎部分有疑慮之初學者,建議可以選購相對應的基礎書籍配合本書一起學習。

產品目錄

產品目錄 CHAPTER 01 Python 基礎CHAPTER 02 寫一個簡單的爬蟲CHAPTER 03 用API 爬取天氣預報資料CHAPTER 04 大型爬蟲案例:抓取某電子商務網站的商品資料CHAPTER 05 Scrapy 爬蟲CHAPTER 06 Selenium 爬蟲CHAPTER 07 資料庫連接和查詢CHAPTER 08 NumPyCHAPTER 09 pandas 資料清洗CHAPTER 10 綜合應用實例CHAPTER 11 資料視覺化

商品規格

書名 / 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版)
作者 / 零一 韓要賓 黃園園
簡介 / 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版):本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本
出版社 / 深石數位科技股份有限公司
ISBN13 / 9789865004583
ISBN10 / 9865004585
EAN / 9789865004583
誠品26碼 / 2681859467008
頁數 / 240
開數 / 18K
注音版 /
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23X1CM
級別 / N:無

最佳賣點

最佳賣點 : 通過實戰教導讀者爬蟲抓取數據資料、進一步分析的技術,適合具備Python操作經驗之使用者、愛好者及高等院校之相關科系等。

試閱文字

自序 : 本書教導讀者如何利用Python撰寫爬蟲程式、組織並分析數據,進一步解析網頁的內容,將數據儲存於數據庫中,不僅內容詳細,各章節更有實際案例,能夠幫助大家節省大量的學習時間。

試閱文字

內文 : 幾乎每一個網站都有一個名為robots.txt的文件,當地也有部分網站沒有設定robots.txt,對於沒有設定robots.txt的網站可以透過網路爬蟲取得沒有密碼加密的資料,也就是該網站所有葉面資料都可以爬取,如果網站有robots.txt文件,就要判斷是否有禁止訪客取得的資料。
以淘寶網為例,在瀏覽器中存取https://www.taobao.com/robots.txt,如圖2-1所示。淘寶網允許部分爬蟲存取他的部分路徑,面對於沒有獲得允許的使用者,則全部禁止爬取,程式如下: