2011年6月10日金曜日

第19回:Open souce Pentaho

今回は、オープンソースのBI製品として有名なPentahoについて紹介したいと思います。

 前回と同様に下記コンポーネントについて対応製品を紹介します。

・ETL
・データウェアハウス(データベース)
・OLAP cube
・BIツール

ETL

 PentahoのETLツールは、「Pentaho Data Integration」という製品になります。
これは、Kettleとも呼ばれています。オープンソースとは言ってもETLに必要な機能はそろっており、
商用に負けない機能となっています。

データウェアハウス(データベース)

 Pentahoには、デフォルトでは、HSQLDBが使用されていますが、MySQLやPostgreSQLなどの
大規模データに対応したオープンソースデータベースを使用することができます。MySQLは、Infobrightや
InfiniDBといったデータウェアハウスに特化した列指向データベースを使用できるので、これらを組み合わせれば、
高速なデータウェアハウスを作成することも可能です。

OLAP cube

 Pentahoでは、「Mondrian」というOLAPエンジンを使用できます。
また、JPivotというツールを使ってMondrianにアクセスできます。
MDXも使用できます。

BIツール
フロントエンドツールもJPivotによるOLAP分析をはじめ、レポーティングやダッシュボードなどの機能がそろっています。
Pentaho1つですべてのツールが揃いますので、商用のツールを買わなくてもオープンソースツールで商用に負けないBIソリューションを
構築することができます。

オープンソースの強みはなんと言っても、価格が安いことだと思います。データウェアハウス/BIは導入しても使いこなせないことが多いので、
いきなり商用ツールの導入はリスクが高いという企業は、Pentahoなどで安価に導入してみるのもいいと思います。

データウェアハウス/BI分野でもその他にも多くのすぐれたオープンソース製品が出ていますので、技術力さえあれば、
テラバイト級のデータにも対応できるシステムを構築することも可能だと思います。

Pentaho以外では、Jaspersoftというオープンソース製品が有名なので、興味のある方はこちらもご検討ください。

次回は、データウェアハウス/BI用語について、一通りのまとめをしたいと思います。

0 件のコメント:

コメントを投稿