データレイク
« Back to Glossary Index
データレイク=”データの湖”(直訳)
様々なソースから取得した多種多様なビッグデータを本来のフォーマットのまま保管する広大な領域のこと。
現在、 IoT のニーズの高まりにより、あらゆるセンサーからのログ、 GPS 情報、 SNS ソーシャルメディアからのフィードデータ、画像・映像、音声などの非構造化データの管理・分析に適し、導入が進んでいます。
「非構造化データ」
ログファイルや画像ファイル、音声ファイルなど特定の構造を持たないデータ
「構造化データ」
リレーショナルデータベースのようにデータの属性を構造的に管理するデータ
従来は、分析の目的に合わせて膨大なデータから必要なものを絞り込み、表計算やデータベースの形式で保存していました。しかし、それでは時間もコストもかかる上、分析する対象が変わったときの柔軟性の問題もありました。一方、データレイクは、あらゆるデータを最初から収集しておくため、効率良く幅広い分析ニーズに応えられるIoTのニーズにこたえられる新しい技術です。
« 用語集一覧に戻る
コメント ( 0 )
トラックバックは利用できません。
この記事へのコメントはありません。