2011年6月21日火曜日

ETL:Excelデータに気をつけよう!

 ETLでデータを取得する際に、ソースデータとして、ファイルが使われることがあります。
たとえば、外部から情報をもらったりする場合ですね。
その際に注意です。おそらく、ソースデータをExcelとして使用する場合が必ず出てきますが、
これはなるべく避けて、テキストデータなどで提供してもらいましょう。

 理由は、Excelを利用すると、簡単に情報が欠落してしまうからです。
たとえば、コードのゼロ抜け。これはよくあります。元データにテキストとして、頭にゼロがついていても
Excelによって数値データと判断され、ゼロが抜けてしまうことがよくあります。

 私もずいぶんExcelで泣かされました。
 なるべく、Excelは避けましょう。

0 件のコメント:

コメントを投稿