現在、データウェアハウスの構築に欠かせないETLツールですが、ETLといってもさまざまな種類があります。
今回は、ETLツールの大きな種類について紹介したいと思います。
自作ETL
これは、そもそものETLの起源となった方法で、つまり、PL/SQLやプログラミング言語でコーディングして自前でETLを作成することである。
現状使用されているETLツールの45%はいまだに自作ツールとのことです。
自作ツールの問題点は、エラー処理、メインテナンス、メタデータ管理、ログなどの機能が弱いことです。開発した人がいなくなったら、誰も触れないと
いう事態になりかねないので、危険です。
コード生成ETL
自作ETLの次に登場したのが、コード生成ETLです。ETLデザインの応じて、コードを生成します。これに該当するETLとして、Open source ETLとして
有名なTalendがあります。
エンジンベースETL
コード生成ETLの次に登場したのが、エンジンベースETLです。コード生成ETLは、コード生成のため、対応するsourceデータベースの製品が限られてしまうという
弱点があります。これを解消したのが、エンジンベースETLです。PentahoのETLツールであるKettleやMicrosoftのSQL Server Integration Servicesは
は、このエンジンベースETLに該当します。
MDA
さらにこの進化型として、ETLとデータウェアハウスをビジネスモデルによって自動化するModel Driven Architecutre (MDA)と呼ばれるツールもあります。
Kalido, BIReadyなどが有名です。
0 件のコメント:
コメントを投稿