GridData Lake ユーザーズガイド

本マニュアルは、GridData Lakeの利用方法について説明したものです。 製品のご使用前に必ずお読みください。

本書に記載されている外部URLについては2018年9月時点のものとなります。

GridData Lakeの製品構成

GridData Lakeは、GridData Lake Server1種のみの製品です。

GridData Lakeのモジュール構成は以下のようになっています。

GridData Lakeのモジュール構成図

GridData Lake Server

GridData Lake Serverは、データレイク環境を提供するオンプレミス製品です。 データ収集ソフトウェアであるFluentdとEmbulkに対応したデータ受信APIサーバーと、HDFSによる並列分散ストレージ、Sparkによる並列分散処理環境を提供します。 GridDBの利用を前提としており、GridDBとHDFSの組み合わせにより非構造・構造化を問わずデータを蓄積することができます。 また、蓄積データや利用アカウントの管理機能、データ編集の実行機能、スケジューラ機能、データエクスポート機能を提供するWebアプリケーションLake Studioを提供します。

商標

  • GridDataとGridDBは、東芝デジタルソリューションズ株式会社の登録商標です。
  • ApacheとHadoop、Spark、ZooKeeper、Hiveは、Apache Software Foundationの米国およびその他の国における登録商標または商標です。
  • PostgreSQLは、PostgreSQLの米国およびその他の国における商標または登録商標です。
  • FluentdとEmbulkはトレジャーデータ株式会社の登録商標です。
  • OracleとJavaは、Oracle Corporation及びその子会社、関連会社の米国及びその他の国における登録商標です。
  • LinuxはLinus Torvalds氏の米国およびその他の国における登録商標あるいは商標です。
  • Red Hat、RPMおよびRed Hatをベースとしたすべての商標とロゴは、Red Hat, Inc.の米国およびその他の国における登録商標あるいは商標です。
  • 本書に掲載の商品の名称は、それぞれ各社が商標として使用している場合があります。