続・RDB 以外のデータベース − Hadoop は NoSQL ??
引き続き、NoSQL について調べていて
分からなくなったこと。。
それが、タイトルにもあるとおり、
「Hadoop は NoSQL なのか?」
です。
HBase はわりかし NoSQL の一種として
紹介されていることが多いのですが、
Hadoop は NoSQL とは区別して記載されている場合も。。
で、いろいろ調べてみた結果がこちら。
(っていっても Wiki からばかり引用してますが)
- HBase(Apache HBase)
Hadoop 分散ファイルシステム
(HDFS = Hadoop Distributed File System)の上で実行する、
列方向、分散型のデータベース(オープンソース)
※ 引用:Apache HBase - Wikipedia
大規模データの分散処理を支える
Java ソフトウェアフレームワーク(フリーソフトウェア)で、
HDFS などのファイルシステムへのアクセスをサポートするもの
※ 引用:Apache Hadoop - Wikipedia
ここから推測した私の見解がこちら。
(間違ってる可能性大なのであくまで一個人の見解、ということで。。)
HBase は RDB ではないので、NoSQL の一種だけれども、 Hadoop はデータベースのことを指す言葉ではないので、 厳密にいうと、NoSQL ではない。
現状を見ると、HBase と Hadoop の密接な関係を考えて、
広義的な意味での Hadoop は
HBase や周辺のモロモロを含んだものを指すこともあり、
NoSQL の一種として捉えられているのかなぁ。
(これには賛否両論ありそうですが;;)
ちなみにここら辺のもやもやは、以下を読むと解決しそう。
NOSQLの基礎知識-ビッグデータを活かすデータベース技術-本橋信也
今抱えている積み本が解消してきたら、手を出してみよう。