データレイク

           

関連記事

    – shutterstock

    データレイク=”データの湖”(直訳)

    様々なソースから取得した多種多様なビッグデータを本来のフォーマットのまま保管する広大な領域のこと。

    現在、 IoT のニーズの高まりにより、あらゆるセンサーからのログ、 GPS 情報、 SNS ソーシャルメディアからのフィードデータ、画像・映像、音声などの非構造化データの管理・分析に適し、導入が進んでいます。

     

    「非構造化データ」

    ログファイルや画像ファイル、音声ファイルなど特定の構造を持たないデータ

    「構造化データ」

    リレーショナルデータベースのようにデータの属性を構造的に管理するデータ

    従来は、分析の目的に合わせて膨大なデータから必要なものを絞り込み、表計算やデータベースの形式で保存していました。しかし、それでは時間もコストもかかる上、分析する対象が変わったときの柔軟性の問題もありました。一方、データレイクは、あらゆるデータを最初から収集しておくため、効率良く幅広い分析ニーズに応えられるIoTのニーズにこたえられる新しい技術です。



     

     

    « Back to Glossary Index