網站擷取: 使用Python (第2版) | 誠品線上

Web Scraping with Python (2 Ed.)

作者 Ryan Mitchell
出版社 聯合發行股份有限公司
商品描述 網站擷取: 使用Python (第2版):在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務

內容簡介

內容簡介 在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」--電子計算機工程師、麻州歐林工程學院/ Eric VanWyk如果程式設計是魔術,那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取,還包含擷取各種現代網站資料的詳盡指南。本書第一部份專注於網站擷取機制:使用Python從網頁伺服器取得資料、執行伺服器回應的基本處理工作、以及與網站的自動化互動。第二部分探索適用於不同擷取場景的各種工具與應用程式。●解析複雜HTML網頁●以Scrapy架構開發爬行程序●學習爬行資料的儲存方式●從文件讀取與提煉資料●清理格式不良的資料●以自然語言讀寫●透過表單與登入的爬行●JavaScript與API爬行●使用影像文字識別軟體●避開爬行陷阱與機器人阻擋程序●使用爬行程序測試你的網站

作者介紹

作者介紹 ■作者簡介Ryan Mitchell是波士頓HedgeServ的資深軟體工程師,為公司開發API與資料分析工具。她畢業於Olin College of Engineering,取得資工學位與Harvard University Extension School的認證。曾任職於Abine,以Python開發爬行程序與自動化工具。為零售、金融、醫療等產業提供網站擷取專案的顧問服務,並曾在Northeastern University與Olin College of Engineering擔任課程顧問和兼職教員。■譯者簡介楊尊一

產品目錄

產品目錄 前言第一部 建構擷取程序第一章 你的第一個擷取程序第二章 進階HTML解析第三章 撰寫網站爬行程序第四章 網站爬行模型第五章 Scrapy第六章 儲存資料第二部 儲存資料第七章 讀取文件第八章 清理髒資料第九章 讀寫自然語言第十章 表單與登入第十一章 與擷取相關的JavaScript第十二章 透過API 爬行第十三章 影像處理與文字辨識第十四章 避開擷取陷阱第十五章 以爬行程序測試你的網站第十六章 平行擷取網站第十七章 遠端擷取第十八章 網站擷取的法規與道德索引

商品規格

書名 / 網站擷取: 使用Python (第2版)
作者 / Ryan Mitchell
簡介 / 網站擷取: 使用Python (第2版):在現代網路蒐集資料「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務
出版社 / 聯合發行股份有限公司
ISBN13 / 9789864769261
ISBN10 / 986476926X
EAN / 9789864769261
誠品26碼 / 2681670953001
頁數 / 280
注音版 /
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 23X18.5X2.5CM
級別 / N:無

最佳賣點

最佳賣點 : 如果程式設計是魔術,那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取,還包含擷取各種現代網站資料的詳盡指南。