データレイク

– shutterstock

データレイク=”データの湖”(直訳)

様々なソースから取得した多種多様なビッグデータを本来のフォーマットのまま保管する広大な領域のこと。

現在、 IoT のニーズの高まりにより、あらゆるセンサーからのログ、 GPS 情報、 SNS ソーシャルメディアからのフィードデータ、画像・映像、音声などの非構造化データの管理・分析に適し、導入が進んでいます。

 

「非構造化データ」

ログファイルや画像ファイル、音声ファイルなど特定の構造を持たないデータ

「構造化データ」

リレーショナルデータベースのようにデータの属性を構造的に管理するデータ

従来は、分析の目的に合わせて膨大なデータから必要なものを絞り込み、表計算やデータベースの形式で保存していました。しかし、それでは時間もコストもかかる上、分析する対象が変わったときの柔軟性の問題もありました。一方、データレイクは、あらゆるデータを最初から収集しておくため、効率良く幅広い分析ニーズに応えられるIoTのニーズにこたえられる新しい技術です。



 

 

« Back to Glossary Index

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。