機器學習概論: 機器學習發展+演算法原理實務 | 誠品線上

機器學習概論: 機器學習發展+演算法原理實務

作者 鄭捷
出版社 佳魁資訊股份有限公司
商品描述 機器學習概論: 機器學習發展+演算法原理實務:本書以機器學習原理和演算法編碼學習為主,內容分二大主線:單個演算法的原理講解和機器學習理論的發展變遷。演算法除包含傳

內容簡介

內容簡介 本書以機器學習原理和演算法編碼學習為主,內容分二大主線:單個演算法的原理講解和機器學習理論的發展變遷。 演算法除包含傳統的分類、聚類、預測等常用演算法之外,還新增深度學習、貝氏網、隱馬克夫模型等內容。每個演算法,都涵蓋提出問題、解決策略、數學推導、編碼實現、結果評估等部分。 數學推導力圖做到深入淺出。結構上數學原理與程式碼一一對照,有助於降低學習門檻,加深公式的理解,發揮推廣和擴大機器學習的作用。適合:對機器學習演算法有興趣者,或工程技術人員。

作者介紹

作者介紹 鄭捷為www.threedweb.cn網站負責人,研究方向是機器學習與自然語言處理。負責高精度自然語言認知系統的設計與研發,研發目標是高精度(識別率在85%~95%)的統一架構的NLP認知系統。

產品目錄

產品目錄 01 機器學習的基礎1.1 程式語言與開發環境1.2 物件、矩陣與向量化程式設計1.3 機器學習的數學基礎1.4 資料處理與視覺化 1.5 Linux 作業系統下部署Python 機器學習開發環境1.6 結語02 中文文字分類2.1 文字採擷與文字分類的概念2.2 文字分類專案2.3 分類演算法:單純貝氏2.4 分類演算法:kNN2.4.3 評估分類結果2.5 結語 03 決策樹的發展3.1 決策樹的基本思想3.2 ID3 決策樹3.3 C4.5 演算法3.4 Scikit-Learn 與回歸樹3.5 結語 04 推薦系統原理4.1 推薦系統概述4.2 協作過濾及其演算法4.3 KMeans 演算法詳解4.4 分群的改進:二分KMeans 演算法4.5 SVD 演算法詳解4.6 結語05 梯度尋優5.1 最最佳化與計算複雜性5.2 Logistic 梯度下降法5.3 演算法分析5.4 隨機梯度下降法:演算法改進與評估5.5 結語 06 神經網路初步6.1 神經網路簡史6.2 BP 神經網路理論6.3 BP 網路的實現和評估6.4 自我組織特徵對映神經網路6.5 Boltzmann 機演算法 6.6 結語07 預測的技術與哲學7.1 線性系統的預測7.2 徑向基網路7.3 嶺回歸7.4 預測的哲學 7.5 結語08 萬能分類器——支援向量機8.1 支援向量機的理論基礎8.2 SVM 的數學推導8.3 SMO 演算法8.4 SVM 中文文字分類8.5 結語09 人臉識別中的機器學習9.1 模式識別概述9.2 人臉檢測9.3 AdaBoost 演算法概述9.4 人臉識別9.5 結語10 認知計算與深度學習10.1 認知計算10.2 多層感知器10.3 旋積神經網路10.4 Theano 安裝與GPU 運算 10.5 結語11 機率圖模型與詞性標記11.1 馬可夫過程11.2 機率圖模型和貝氏網11.3 隱馬可夫模型11.4 詞性標記系統11.5 結語

商品規格

書名 / 機器學習概論: 機器學習發展+演算法原理實務
作者 / 鄭捷
簡介 / 機器學習概論: 機器學習發展+演算法原理實務:本書以機器學習原理和演算法編碼學習為主,內容分二大主線:單個演算法的原理講解和機器學習理論的發展變遷。演算法除包含傳
出版社 / 佳魁資訊股份有限公司
ISBN13 / 9789863797920
ISBN10 / 9863797928
EAN / 9789863797920
誠品26碼 / 2681849102001
頁數 / 496
開數 / 18K
注音版 /
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23X2.4CM
級別 / N:無

最佳賣點

最佳賣點 : 今天不學機器學習,明天就被機器取代!
▶圍繞三大主線:神經網路、智慧推理、矩陣計算
▶提供豐富案例:近25個經典的演算法講解
▶解剖具代表性的演算法:Scikit-Learn、OpenCV、Theano

試閱文字

自序 : 01 機器學習的基礎
1.1 程式語言與開發環境
1.2 物件、矩陣與向量化程式設計
1.3 機器學習的數學基礎
1.4 資料處理與視覺化
1.5 Linux 作業系統下部署Python 機器學習開發環境
1.6 結語
02 中文文字分類
2.1 文字採擷與文字分類的概念
2.2 文字分類專案
2.3 分類演算法:單純貝氏
2.4 分類演算法:kNN
2.4.3 評估分類結果
2.5 結語
03 決策樹的發展
3.1 決策樹的基本思想
3.2 ID3 決策樹
3.3 C4.5 演算法
3.4 Scikit-Learn 與回歸樹
3.5 結語
04 推薦系統原理
4.1 推薦系統概述
4.2 協作過濾及其演算法
4.3 KMeans 演算法詳解
4.4 分群的改進:二分KMeans 演算法
4.5 SVD 演算法詳解
4.6 結語
05 梯度尋優
5.1 最最佳化與計算複雜性
5.2 Logistic 梯度下降法
5.3 演算法分析
5.4 隨機梯度下降法:演算法改進與評估
5.5 結語
06 神經網路初步
6.1 神經網路簡史
6.2 BP 神經網路理論
6.3 BP 網路的實現和評估
6.4 自我組織特徵對映神經網路
6.5 Boltzmann 機演算法
6.6 結語
07 預測的技術與哲學
7.1 線性系統的預測
7.2 徑向基網路
7.3 嶺回歸
7.4 預測的哲學
7.5 結語
08 萬能分類器——支援向量機
8.1 支援向量機的理論基礎
8.2 SVM 的數學推導
8.3 SMO 演算法
8.4 SVM 中文文字分類
8.5 結語
09 人臉識別中的機器學習
9.1 模式識別概述
9.2 人臉檢測
9.3 AdaBoost 演算法概述
9.4 人臉識別
9.5 結語
10 認知計算與深度學習
10.1 認知計算
10.2 多層感知器
10.3 旋積神經網路
10.4 Theano 安裝與GPU 運算
10.5 結語
11 機率圖模型與詞性標記
11.1 馬可夫過程
11.2 機率圖模型和貝氏網
11.3 隱馬可夫模型
11.4 詞性標記系統
11.5 結語

試閱文字

內文 : 3.4.3 模型樹
使用CART 進行預測是把葉子節點設定為一系列的分段線性函數,這些分段
線性函數是對來源資料曲線的一種模擬,每個線性函數都被稱為一棵模型樹。
模型樹具有很多優秀的性質,它包含了以下的特徵。
■■一般而言,樣本整體的重複性不會很高,但局部模式經常重複,也就是我
們所說的歷史不會簡單地重複,但會重演。模型比整體對未來的預測而言
更有用。
■■模型列出了資料的範圍,它可能是一個時間範圍,也可能是一個空間範圍;
而且模型還列出了變化的趨勢,可以是曲線,也可以是直線,這依賴於使
用的回歸演算法。這些因素使模型具有很強的可解釋性。
■■傳統的回歸方法,無論是線性回歸還是非線性回歸,都不如模型樹包含的
資訊豐富,因此模型樹具有更高的預測準確度。
也可以用CART 單獨建立模型樹。它的建立過程大致上與回歸樹是一樣的,
這裡就不細說了。
3.4.4 剪枝策略
因為使用了連續性資料,CART 可以生長出大量的分支樹,為了避免過擬合的
問題,預測樹採用了剪枝的方法。剪枝方法有很多,主流的方法有兩種:先剪
枝和後剪枝。先剪枝列出一個預先定義的劃分設定值,當節點的劃分子集某個
標準低於預先定義的設定值時,子集劃分將終止。但是選取適當的設定值比較
困難,過高會導致過擬合,而過低會導致欠擬合,因此需要人工反覆地訓練樣
本才能獲得很好的效果。預剪枝也有優勢,由於它不必產生整棵決策樹,且演
算法簡單、效率高,適合大規模問題的粗略估計。
另一種剪枝策略是後剪枝,也稱為悲觀剪枝。後剪枝是指在完全產生的決策樹
上,根據一定的規則標準,剪掉樹中不具備一般代表性的子樹,使用葉子節點
取而代之,進而形成一棵規模較小的新樹。後剪枝遞迴估算每個內部節點所覆
蓋樣本節點的誤判率,也就是計算決策樹內部節點的誤判率。如果內部節點的