ゼロから作るDeep Learning 4: 強化学習編
作者 | 斎藤康毅 |
---|---|
出版社 | 聯合發行股份有限公司 |
商品描述 | Deep Learning 4: 用Python進行強化學習的開發實作:本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習, |
作者 | 斎藤康毅 |
---|---|
出版社 | 聯合發行股份有限公司 |
商品描述 | Deep Learning 4: 用Python進行強化學習的開發實作:本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習, |
內容簡介 本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。 從「理論」與「實踐」兩方面著手,仔細解說強化學習這個複雜主題的構成要素,讓讀者確實掌握強化學習的獨特理論。有別於只用公式說明理論的書籍,讀者可以從書中的程式碼,獲得許多意想不到的領悟。
作者介紹 1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。1984年生於長崎縣對馬,畢業於東京工業大學工學院,東京大學研究所學際情報學府學士課程修畢。現在於企業內從事與電腦視覺、機器學習有關的研究開發工作。
產品目錄 第 1 章 吃角子老虎機問題 第 2 章 馬可夫決策過程 第 3 章 貝爾曼方程式 第 4 章 動態規劃法 第 5 章 蒙地卡羅法 第 6 章 TD 法 第 7 章 類神經網路與 Q 學習 第 8 章 DQN 第 9 章 策略梯度法 第 10 章 進階內容 附錄 A 離線策略蒙地卡羅法 附錄 B n 步 TD 法 附錄 C 理解 Double DQN 附錄 D 驗證策略梯度法
書名 / | Deep Learning 4: 用Python進行強化學習的開發實作 |
---|---|
作者 / | 斎藤康毅 |
簡介 / | Deep Learning 4: 用Python進行強化學習的開發實作:本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習, |
出版社 / | 聯合發行股份有限公司 |
ISBN13 / | 9786263246119 |
ISBN10 / | |
EAN / | 9786263246119 |
誠品26碼 / | 2682443472002 |
頁數 / | 344 |
裝訂 / | P:平裝 |
語言 / | 1:中文 繁體 |
尺寸 / | 18.5x23x1.9 |
級別 / | N:無 |
最佳賣點 : 本暢銷系列作品的第4本書,這次的主題是強化學習。書中延續此系列的一貫風格,顯示實際的程式碼,讓讀者邊執行邊學習,不依賴外部程式庫,從零開始建置、學習支撐強化學習的基本技術與概念。