入手大數據DB的輕鬆選擇: HBase快上手 (熱銷版) | 誠品線上

入手大數據DB的輕鬆選擇: HBase快上手 (熱銷版)

作者 楊曦
出版社 佳魁資訊股份有限公司
商品描述 入手大數據DB的輕鬆選擇: HBase快上手 (熱銷版):■如果你還在尋找合適的環境,或想快速了解HBase功能,或你是公司的運行維護工程師,想知道如何架設HBase,「第2章讓HBase

內容簡介

內容簡介 ■ 如果你還在尋找合適的環境,或想快速了解HBase功能,或你是公司的運行維護工程師,想知道如何架設HBase,「第2 章 讓HBase 跑起來」適合你。■ 如果公司的運行維護工程師幫你架好環境,老闆催著你趕快做出專案,那麼 請直接看「第4 章 用戶端API 入門」。■ 如果你更關心HBase 是如何實現它的資料結構的,建議你直接看「第5 章 HBase 內部探險」。■ 如果你想知道HBase如何提升效能,建議你直接看「第8章 再快一點」。 適用:HBase初學者、希望深入掌握HBase的讀者、HBase應用開發人員和系統管理人員。

產品目錄

產品目錄 01 初識HBase1.1 巨量資料與NoSQL1.2 HBase 是怎麼來的1.3 為什麼要用HBase1.4 你必須懂的基本概念02 讓HBase 跑起來2.1 本書測試環境2.2 設定2.3 設定SSH 免密登入2.4 安裝Hadoop2.5 安裝HBase03 HBase 基本操作3.1 hbase shell 的使用3.2 使用Hue 來檢視HBase 資料04 用戶端API 入門4.1 10 分鐘教學4.2 30 分鐘教學4.3 CRUD 一個也不能少4.4 批次操作4.5 BufferedMutator(選讀)4.6 Scan 掃描4.7 HBase 支援什麼資料格式4.8 歸納05 HBase 內部探險5.1 資料模型5.2 HBase 是怎麼儲存資料的5.3 一個KeyValue 的歷險5.4 Region 的定位06 用戶端API 的高階用法6.1 篩檢程式6.2 輔助處理器07 用戶端API 的管理功能7.1 列簇管理7.2 表管理7.3 Region 管理7.4 快照管理7.5 維護工具管理7.6 叢集狀態以及負載(ClusterStatus & ServerLoad)7.7 Admin 的其他方法7.8 可見性標籤管理08 再快一點8.1 Master 和RegionServer 的JVM 最佳化8.2 Region 的拆分8.3 Region 的合併8.4 WAL 的最佳化8.5 BlockCache 的最佳化8.6 Memstore 的最佳化8.7 HFile 的合併8.8 診斷手冊09 當HBase 遇上MapReduce9.1 為什麼要用MapReduce9.2 快速入門9.3 慢速入門:撰寫自己的MapReduce9.4 相關類別介紹

商品規格

書名 / 入手大數據DB的輕鬆選擇: HBase快上手 (熱銷版)
作者 / 楊曦
簡介 / 入手大數據DB的輕鬆選擇: HBase快上手 (熱銷版):■如果你還在尋找合適的環境,或想快速了解HBase功能,或你是公司的運行維護工程師,想知道如何架設HBase,「第2章讓HBase
出版社 / 佳魁資訊股份有限公司
ISBN13 / 9789863797746
ISBN10 / 986379774X
EAN / 9789863797746
誠品26碼 / 2681815302008
頁數 / 544
開數 / 18K
注音版 /
裝訂 / P:平裝
語言 / 1:中文 繁體
尺寸 / 17X23X2.2CM
級別 / N:無

最佳賣點

最佳賣點 : 由淺入深地講解HBase概念、安裝、配置、部署,從應用角度介紹高階用法、監控和性能最佳化;HBase是Apache旗下一個高可靠性、高性能、面向列、可伸縮的分散式存儲系統, 全書共分9章,由淺入深地講解HBase概念、安裝、配置、部署,再從應用角度介紹高階用法、監控和性能最佳化。

試閱文字

自序 : 前言

  我們發現阻礙人們學習新技術最大的障礙不是技術的難度或條件的限制,而是學習技術時難以抵擋的睏意,所以我們的目標就是寫一本讓人看了不會睡著的HBase 技術書籍。希望大家可以透過這本書成功地入門HBase 技術。

  為什麼要寫這本書?

  ■ 目前網上關於HBase的知識比較零碎,缺乏系統性。翻譯的作品,語言的組織又不符合國人的習慣。
  ■ 目前的資料都很舊。連英文的資料很多都過時了,例如現在很多的書籍和網上的資料都還在介紹三層查詢架構,可是HBase 早已經改成二層查詢架構了。實際操作到的跟書上的操作不一樣,這很讓人沮喪。

  ✤ 如何才能不睡著地看本書
  作為本書的作者我強烈不建議大家從頭按順序地讀到尾,這不是一種好的讀書方式,而且極容易睡著。看書應該是非線性的,先掃一遍目錄,然後只看適合自己的,最後再發散式地補看別的章節。

  ■ 如果你手頭沒有合適的環境,或你想快速了解HBase能做什麼,或你是公司的運行維護人員,想知道怎麼架設HBase,「第2 章 讓HBase 跑起來」適合你。
  ■ 如果公司的運行維護幫你建置好環境,老闆催著你趕緊做出專案,那麼請直接看「第4 章 用戶端API 入門」。
  ■ 如果你更關心HBase 是如何實現它的資料結構的,建議你直接看「第5 章 HBase 內部探險」。
  ■ 如果你想知道HBase如何提升效能,建議你直接看「第8章 再快一點」。

  如果你還是覺得睏,那一定不是這本書的關係,是你的確缺乏睡眠,請馬上去睡覺,有精神了再來看書。看得慢,看得少都沒有關係,千萬別睏著看!

  ✤ 如何才能不睡著地看所有書
  為什麼我們看技術書籍總是犯睏呢?
  因為技術書籍必須把方法和基礎知識都寫全面,否則容易誤導讀者,你可以把技術書籍看成是一本電話黃頁。我們總是錯誤地以為既然要學習,那麼每一個基礎知識、每一個方法都不能錯過,所以認真地精讀每一本技術書籍。你想像一下,如果你精讀一本電話黃頁,會不會感到疲勞?會不會忍不住睡去?

  其實不光是讀本書,學習所有的技術書籍都應該掌握正確的方法。那就是:跳著看,具體地說就是不要針對每一個API 方法都精讀,這樣很容易迷失在一長串的API 方法列表中,感到疲勞,導致無法堅持下去;而是針對某個基礎知識精細地掌握某一個方法親自實作,然後別的方法快速略讀過去,等需要用的時候再回來查閱。我們需要把每一本技術書籍都看成入門教學 + 技術手冊,第一遍閱讀的時候把每個基礎知識挑出一個方法作為入門,把其他方法當作技術手冊來查閱,你總不會想細讀一本電話黃頁吧。

  本書在很多地方都列出閱讀提示,提醒大家不要精讀,該略過的部分就要勇敢地略過。

  ✤ 這本書不是HBase 知識大全
  這本書的目的只是讓你學會HBase。有些基礎知識並沒有有關,例如叢集備份、ACL 許可權控制、REST 用戶端等,所以想學習這些知識的讀者們可能要失望了。我只能讓讀者愉快地入門,更深層次的知識就看你們自己的努力了!

  ✤ 技術支援與致謝
  如果你在閱讀本書時發現問題或不足之處,請發郵件到:alexyang11@qq.com 告訴我。
  部分彩色圖片可到下面網址(注意數字與字母大小寫)下載:
pan.baidu.com/s/1slqjJnZ

  最後感謝我的家人、朋友、同事對我撰寫本書的幫助,感謝清華大學出版社的夏毓彥編輯,感謝HBase Team 的Ted Yu,沒有他們的幫助,我不可能完成本書!

試閱文字

內文 : 3.1.9 用disable 來停用表
有了建表,新增記錄,刪除記錄,接著說明如何刪除表了。說明刪除之前必
須先說下停用(disable)指令。在使用HBase 的時候,表是不可以說刪就刪
的,因為可能有很多用戶端現在正好連著,或HBase 正在做合併或分裂操
作。如果你這時刪除了表,會造成無法恢復的錯誤,HBase 也不會讓你直接
就刪除表,而是需要先做一個disable 操作,意思是把這個表停用掉,並且下
線。現在我們來用disable 把之前建立的測試表test 停用掉:
disable 'test'
在沒有什麼資料或沒有什麼人使用的情況下這行指令執行得很快,但如果在
系統已經上線了,並且負載很大的情況下disable 指令會執行得很慢,因為
disable 要通知所有的RegionServer 來下線這個表,並且有很多有關該表的操
作需要被停用掉,以保障該表真的已經完全不參與任何工作了。
當你停用掉一個表後,你可以用scan 測試一下表是不是真的被關閉了:
scan 'test'
ROW COLUMN+CELL
3-14
ERROR: test is disabled.
你會發現無法使用scan 指令, 並且會輸出一個錯誤訊息ERROR: xxxx is
disabled,意思是表已經被關閉了,不能scan 了。
3.1.10 用drop 來刪除表
用disable 停用表後,我們就可以放心地刪除表了。刪除表的敘述很簡單,就
是drop。現在我們來試下用drop 指令把test 表刪除掉。
drop 'test'
執行後再用list 看下資料庫中有什麼表:
list
TABLE
0 row(s) in 0.0300 seconds
發現資料庫中的test 表已經被刪除了。
關於hbase shell 的基本操作就說這麼多了。更實際的指令列表和指令的用
法,請在下一個小節中去檢視。
3.1.11 shell 指令列表
強烈建議大家略讀或跳過該小節,等需要用到這些指令的時候再回來查閱。強
行閱讀,可能睡著哦。
在介紹指令列表之前,首先要告訴大家的是:使用help 指令可以檢視實際指
令的說明,例如:
hbase(main):030:0> help 'put'
Put a cell 'value' at specified table/row/column and optionally
timestamp coordinates. To put a cell value into table 'ns1:t1' or 't1'
at row 'r1' under column 'c1' marked with the time 'ts1', do: