今回は、オープンソースのBI製品として有名なPentahoについて紹介したいと思います。
前回と同様に下記コンポーネントについて対応製品を紹介します。
・ETL
・データウェアハウス(データベース)
・OLAP cube
・BIツール
ETL
PentahoのETLツールは、「Pentaho Data Integration」という製品になります。
これは、Kettleとも呼ばれています。オープンソースとは言ってもETLに必要な機能はそろっており、
商用に負けない機能となっています。
データウェアハウス(データベース)
Pentahoには、デフォルトでは、HSQLDBが使用されていますが、MySQLやPostgreSQLなどの
大規模データに対応したオープンソースデータベースを使用することができます。MySQLは、Infobrightや
InfiniDBといったデータウェアハウスに特化した列指向データベースを使用できるので、これらを組み合わせれば、
高速なデータウェアハウスを作成することも可能です。
OLAP cube
Pentahoでは、「Mondrian」というOLAPエンジンを使用できます。
また、JPivotというツールを使ってMondrianにアクセスできます。
MDXも使用できます。
BIツール
フロントエンドツールもJPivotによるOLAP分析をはじめ、レポーティングやダッシュボードなどの機能がそろっています。
Pentaho1つですべてのツールが揃いますので、商用のツールを買わなくてもオープンソースツールで商用に負けないBIソリューションを
構築することができます。
オープンソースの強みはなんと言っても、価格が安いことだと思います。データウェアハウス/BIは導入しても使いこなせないことが多いので、
いきなり商用ツールの導入はリスクが高いという企業は、Pentahoなどで安価に導入してみるのもいいと思います。
データウェアハウス/BI分野でもその他にも多くのすぐれたオープンソース製品が出ていますので、技術力さえあれば、
テラバイト級のデータにも対応できるシステムを構築することも可能だと思います。
Pentaho以外では、Jaspersoftというオープンソース製品が有名なので、興味のある方はこちらもご検討ください。
次回は、データウェアハウス/BI用語について、一通りのまとめをしたいと思います。
0 件のコメント:
コメントを投稿