30天系列 Day 29-End Of 30 Days Series
30 天系列到了尾聲,最後來談談Hadoop Ecosystem的未來。 Hadoop剛發表的時候影響整個檔案系統的生態,以往在單一機器無法處理或是儲存有所限制的使用情境都因Hadoop得以解決。
30 天系列到了尾聲,最後來談談Hadoop Ecosystem的未來。 Hadoop剛發表的時候影響整個檔案系統的生態,以往在單一機器無法處理或是儲存有所限制的使用情境都因Hadoop得以解決。
介紹完Hadoop Ecosystem的Hadoop、HBase、Spark、Hive後,想必大家對這些工具有更近一步的了解。 接下來要介紹幾個這些工具的使用情境,讓大家可以更了解使用時機。
使用複雜的Hive SQL語法查詢時,預設狀況下是使用MapReduce來進行運算。自從Apache Spark出現之後,MapReduce已經有逐漸被取代的跡象。 Apache Hive在1.1版本推出Hive On Spark功能,透過Spark高效能計算速度的優點,讓使用者有更好的使用者體驗。
前面有介紹Hive的安裝方式,想必大家也了解並且知道怎麼使用Hive SQL來對HDFS進行查詢。
今天要來介紹如何透過使用Hive來對HBase table進行查詢。由前面的HBase篇章已經知道HBase本身是沒有提供SQL查詢的介面與功能, 只能依賴其他的工具,例如 Phoenix 或是本篇要介紹的 Hive。