Web Scraping with Python
作者 | Ryan Mitchell |
---|---|
出版社 | 聯合發行股份有限公司 |
商品描述 | 網站擷取: 使用Python:在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解 |
作者 | Ryan Mitchell |
---|---|
出版社 | 聯合發行股份有限公司 |
商品描述 | 網站擷取: 使用Python:在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解 |
內容簡介 ●學會如何解析複雜的HTML頁面●走訪許多頁面與網站●掌握APIs的概觀以及它們如何運作●學會多種儲存搜刮來的資料的方式●下載文件並讀取內容,從中擷取資料●使用工具與技巧整理格式雜亂的原始資料●讀寫自然語言●爬過表單與登入頁●瞭解如何搜刮JavaScript●學會影像處理與文字識別「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」— Eric VanWyk, 電子計算機工程師,麻州歐林工程學院 學會網頁搜刮(scraping)及爬行(crawling)技術,就能從任何網站來源取得任意格式的無限量資料。您可以從這本實務指南學到如何使用Python與web APIs,同時從上千,甚至上百萬的網頁之中獲取並處理資料。 本書適合會寫Python的程式設計者、網路安全工作者以及網站管理者閱讀。不僅會提到網頁搜刮的基本機制,還會提到一些進階主題,像是分析原始資料,或是利用搜刮工具進行網站前端測試。本書也將提供程式範例協助您從實務的角度理解觀念。
作者介紹 ■作者簡介Ryan Mitchell波士頓LinkeDrive的軟體工程師,她為公司開發了API與資料分析工具,經常為金融與零售業界提供網站擷取技術的諮詢。 ■譯者簡介Studio Tib.
產品目錄 第一部分 建構 Scraper第一章 您的第一個 Scraper第二章 進階 HTML 解析第三章 開始爬行第四章 使用 API第五章 儲存資料第六章 讀取文件第二部分 進階 Scraping第七章 清理您的髒資料第八章 讀寫自然語言第九章 爬過表單與登入頁第十章 搜刮 JavaScript第十一章 影像處理與文字辨識第十二章 避開 Scraping 陷阱第十三章 以 Scrapers 測試您的網站第十四章 遠端 Scraping附錄A Python 概覽 附錄B Internet 概覽附錄C 擷取網頁時的法律與道德考量
書名 / | 網站擷取: 使用Python |
---|---|
作者 / | Ryan Mitchell |
簡介 / | 網站擷取: 使用Python:在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解 |
出版社 / | 聯合發行股份有限公司 |
ISBN13 / | 9789864761753 |
ISBN10 / | 9864761757 |
EAN / | 9789864761753 |
誠品26碼 / | 2681380276001 |
頁數 / | 256 |
注音版 / | 否 |
裝訂 / | P:平裝 |
語言 / | 1:中文 繁體 |
尺寸 / | 23X18.5CM |
級別 / | N:無 |