GridData Analytics ユーザーズガイド

本マニュアルは、GridData Analyticsの各製品の利用方法について説明したものです。 製品のご使用前に必ずお読みください。

本書に記載されている外部URLについては2018年9月時点のものとなります。

GridData Analyticsの製品構成

GridData Analyticsは以下の製品群から構成されています。

  • GridData Analytics Server
  • GridData Analytics Scale Server

各製品の関係性とモジュール構成は以下のようになっています。

GridData Analyticsのモジュール構成図

GridData Analytics Server

GridData Analytics Serverは、以下の二つの環境を提供します。

  • データ分析者向けに分析・モデルの生成・評価などを行う分析環境
  • 作成したスクリプトの展開や運用を行う実行環境

このうち、本製品では分析環境をGridData Analytics Studioと呼びます。

GridData Analytics Studioを使用する場合は、分析用のスクリプトと実行結果をノートブックという一つのファイルにまとめることができます。 ノートブックの管理、実行にはJupyter Notebookを利用します。 ノートブックを使用することで、PythonやRなどのプログラミング言語を用いて分析スクリプトを記述し、その場でスクリプトを実行して結果を確認することができます。 また、Jupyter Notebookはサーバー上でWebアプリケーションとして動作し、クライアントからブラウザでアクセスして利用することができます。

作成したスクリプトの展開や運用を行う場合は、ノートブックをコマンドやスケジューラから実行することができ、 またノートブックにWeb APIスクリプトを記述することで、GridData Analytics ServerでWeb APIサーバーを起動することができます。

なお、いずれの実行環境を利用する場合でも、GridData Analytics Serverは単体でご利用頂けますが、 並列分散処理でノートブックを実行する場合にはGridData Analytics Scale Serverが必要です。

GridData Analytics Scale Server

GridData Analytics Scale Serverは、ノートブックの並列分散処理環境を提供する製品です。 複数のサーバー上にApache SparkとHDFSのクラスターを構成し、 GridData Analytics ServerのJupyter Notebookから、ノートブックの処理をSparkクラスター上で実行します。

商標

  • GridDataとGridDBは、東芝デジタルソリューションズ株式会社の登録商標です。
  • ApacheとHadoop、Spark、ZooKeeper、Hiveは、Apache Software Foundationの米国およびその他の国における登録商標または商標です。
  • OracleとJavaは、Oracle Corporation及びその子会社、関連会社の米国及びその他の国における登録商標です。
  • CUDAは、米国および/または他国のNVIDIA Corporationの商標および/または登録商標です。
  • LinuxはLinus Torvalds氏の米国およびその他の国における登録商標あるいは商標です。
  • RHEL、RPMおよびRHELをベースとしたすべての商標とロゴは、Red Hat , Inc.の米国およびその他の国における登録商標あるいは商標です。
  • PythonおよびPythonをベースとしたロゴは、Python Software Foundation の米国およびその他の国における登録商標あるいは商標です。
  • 本書に掲載の商品の名称は、それぞれ各社が商標として使用している場合があります。