2011年5月1日日曜日

第2回:データウェアハウスアーキテクチャ(1):インモンのコーポレートインフォメーションファクトリー

今回から3回にわたって、データウェアハウスのアーキテクチャについて説明します。

データウェアハウス業界では昔からアーキテクチャについて大きく2つのグループに分かれており、どちらのアーキテクチャモデルがよいかが争っています。その2つのグループはインモンが提唱する「コーポレートインフォメーションファクトリー」とキンボールが提唱する「ディメンショナルデータウェアハウス」の2つです。本コラムでは、この2つのアーキテクチャモデルともう1つ有力な:データボルトマネジメントモデルの3つについて紹介いたします。

今回はインモンの「コーポレートインフォメーションファクトリー」について説明します。

コーポレートインフォメーションファクトリー
コーポレートインフォメーションファクトリーとは、データベースの父と言われるビル・インモンが提唱したアーキテクチャの構造です。では、どのようなアーキテクチャかというと、エンタープライズデータウェアハウスという企業のすべてのデータを集めたセントラルデータベースを構築し、そこから各部署で分析に必要なデータをデータマートとして、抽出、構築して分析はそのデータマートに対して分析をおこなうというものです。

エンタープライズデータウェアハウスは、通常のデータベース設計で使用される正規化を利用して構築されます。クエリパフォーマンスが悪くなるためこちらでは直接分析クエリの実行は行いません。データマートは、非正規化し、データウェアハウスの分析に適したディメンショナルモデリングで構築を行います。ディメンショナルモデリングについては第5回〜第9回で詳細に説明を行います。

データウェアハウス 2.0
また、最近インモンはデータウェアハウス2.0を提供しています。2.0を利用するのは、Web 2.0の影響でずいぶんはやりましたね。では、データウェアハウス2.0はインフォメーションファクトリーとどう違うかというと、全体では大きな違いはありません。大きな特徴と言えば、メールやWeb、ツイッターのつぶやきなどの非構造化データを考慮していることでしょう。企業にとって、このような非構造化データの分析はますます重要になってきています。まだ、企業での需要はそんなに多くないようですが、今後データウェアハウスの構築の際に考慮が必要になってくると思います。

うれしいことにインモンの本については日本語版があります。より詳しい内容を知りたい人は下記の本を読むことをお勧めします。


ただ、上記の本は出版されてから年月がかなり経っていますので、英語が読める人は下記のインモン本をお勧めします。


データウェア2.0を知りたい人はこちら。

0 件のコメント:

コメントを投稿