數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版)
作者 | 零一/ 韓要賓/ 黃園園 |
---|---|
出版社 | 深石數位科技股份有限公司 |
商品描述 | 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版):本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本 |
作者 | 零一/ 韓要賓/ 黃園園 |
---|---|
出版社 | 深石數位科技股份有限公司 |
商品描述 | 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版):本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本 |
內容簡介 本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本書簡化了Python基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容,至於對Python基礎部分有疑慮之初學者,建議可以選購相對應的基礎書籍配合本書一起學習。
產品目錄 CHAPTER 01 Python 基礎CHAPTER 02 寫一個簡單的爬蟲CHAPTER 03 用API 爬取天氣預報資料CHAPTER 04 大型爬蟲案例:抓取某電子商務網站的商品資料CHAPTER 05 Scrapy 爬蟲CHAPTER 06 Selenium 爬蟲CHAPTER 07 資料庫連接和查詢CHAPTER 08 NumPyCHAPTER 09 pandas 資料清洗CHAPTER 10 綜合應用實例CHAPTER 11 資料視覺化
書名 / | 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版) |
---|---|
作者 / | 零一 韓要賓 黃園園 |
簡介 / | 數據乃AI之基石: 用Python爬蟲抓取大量資料 (熱銷版):本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做分析及儲存;本 |
出版社 / | 深石數位科技股份有限公司 |
ISBN13 / | 9789865004583 |
ISBN10 / | 9865004585 |
EAN / | 9789865004583 |
誠品26碼 / | 2681859467008 |
頁數 / | 240 |
開數 / | 18K |
注音版 / | 否 |
裝訂 / | P:平裝 |
語言 / | 1:中文 繁體 |
尺寸 / | 17X23X1CM |
級別 / | N:無 |
最佳賣點 : 通過實戰教導讀者爬蟲抓取數據資料、進一步分析的技術,適合具備Python操作經驗之使用者、愛好者及高等院校之相關科系等。
自序 : 本書教導讀者如何利用Python撰寫爬蟲程式、組織並分析數據,進一步解析網頁的內容,將數據儲存於數據庫中,不僅內容詳細,各章節更有實際案例,能夠幫助大家節省大量的學習時間。
內文 : 幾乎每一個網站都有一個名為robots.txt的文件,當地也有部分網站沒有設定robots.txt,對於沒有設定robots.txt的網站可以透過網路爬蟲取得沒有密碼加密的資料,也就是該網站所有葉面資料都可以爬取,如果網站有robots.txt文件,就要判斷是否有禁止訪客取得的資料。
以淘寶網為例,在瀏覽器中存取https://www.taobao.com/robots.txt,如圖2-1所示。淘寶網允許部分爬蟲存取他的部分路徑,面對於沒有獲得允許的使用者,則全部禁止爬取,程式如下: