大數據的下一步: Spark MLlib機器學習實戰技巧大公開 | 誠品線上

大數據的下一步: Spark MLlib機器學習實戰技巧大公開

作者 王曉華
出版社 佳魁資訊股份有限公司
商品描述 大數據的下一步: Spark MLlib機器學習實戰技巧大公開:本書特色●從應用實作出發:儘量避免純粹的理論知識介紹和高深技術研討,用最簡單的、典型的範例引伸出核心知識,最

內容簡介

內容簡介 本書特色● 從應用實作出發:儘量避免純粹的理論知識介紹和高深技術研討,用最簡單的、典型的範例引伸出核心知識,最後還指出通往「高精尖」進一步深入學習的道路。● 系統介紹MLlib全貌:全面介紹了MLlib相關資料採擷的基本結構與上層程式設計,讓讀者在學習過程中不至於迷失方向。● 簡潔的理論:本書在寫作上淺顯容易,沒有深奧的數學知識,讓讀者透過輕鬆愉悅地閱讀掌握相關內容。● 創新的技術:每章都會用範例描述的形式,幫助讀者更進一步地學習內容。● 程式遵循重建原理:避免程式污染,引導讀者寫出優秀、簡潔、可維護的程式。適用:欲接觸或對Spark MLlib有興趣的讀者最佳入門書,亦適合大數據採擷、分析等相關領域之從業人員與師生作為參考之用。

作者介紹

作者介紹 ■作者簡介王曉華

產品目錄

產品目錄 Chapter 01 星星之火1.1 大數據時代1.2 大數據分析時代1.3 簡單、優雅、有效--這就是Spark1.4 核心--MLlib1.5 星星之火,可以燎原1.6 小結Chapter 02 Spark安裝和開發環境設定2.1 Windows 單機模式Spark安裝和設定2.2 經典的WordCount2.3 小結Chapter 03 RDD詳解3.1 RDD是什麼3.2 RDD工作原理3.3 RDD應用API詳解3.4 小結Chapter 04 MLlib基本概念4.1 MLlib基本資料型態4.2 MLlib數理統計基本概念4.3 小結Chapter 05 協作過濾演算法5.1 協作過濾5.2 相似度度量5.3 MLlib中的交替最小平方法(ALS演算法)5.4 小結Chapter 06 MLlib線性回歸理論與實戰6.1 隨機梯度下降演算法詳解6.2 MLlib回歸的過擬合6.3 MLlib線性回歸實戰6.4 小結Chapter 07 MLlib分類實戰7.1 邏輯回歸詳解7.2 支援向量機詳解7.3 單純貝氏詳解7.4 小結Chapter 08 決策樹與保序回歸8.1 決策樹詳解8.2 保序回歸詳解8.3 小結Chapter 09 MLlib中分群詳解9.1 分群與分類9.2 MLlib 中的Kmeans演算法9.3 高斯混合分群9.4 快速反覆運算分群9.5 小結Chapter 10 MLlib中連結規則10.1 Apriori頻繁項集演算法10.2 FP-growth演算法10.3 小結Chapter 11 資料降維11.1 奇異值分解(SVD)11.2 主成分分析(PCA)11.3 小結Chapter 12 特徵分析和轉換12.1 TF-IDF12.2 詞向量化工具12.3 以卡方檢定為基礎的特徵選擇12.4 小結Chapter 13 MLlib實戰演練--鳶尾花分析13.1 建模說明13.2 資料前置處理和分析13.3 長與寬之間的關係--資料集的回歸分析13.4 使用分類和分群對鳶尾花資料集進行處理13.5 最後的判斷--決策樹測試13.6 小結

商品規格

書名 / 大數據的下一步: Spark MLlib機器學習實戰技巧大公開
作者 / 王曉華
簡介 / 大數據的下一步: Spark MLlib機器學習實戰技巧大公開:本書特色●從應用實作出發:儘量避免純粹的理論知識介紹和高深技術研討,用最簡單的、典型的範例引伸出核心知識,最
出版社 / 佳魁資訊股份有限公司
ISBN13 / 9789863796794
ISBN10 / 9863796794
EAN / 9789863796794
誠品26碼 / 2681613068007
頁數 / 264
開數 / 18K
注音版 /
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23CM
級別 / N:無