GridData Analytics 管理者ガイド

本マニュアルは、以下の各製品のインストール、設定及び運用方法について説明したものです。 製品のご使用前に必ずお読みください。

  • GridData Analytics Studio
  • GridData Analytics Server
  • GridData Analytics Scale Server

本書に記載されている外部URLについては2017年10月時点のものとなります。

GridData Analyticsの各製品(GridData Analytics Studio、GridData Analytics Server、 GridData Analytics Scale Server)のソフトウェア構成図は下図の通りです。

GridData Analytics StudioおよびGridData Analytics Serverのソフトウェア構成図

各製品は、Anaconda、Spark(Apache Spark)、HDFS(Apache Hadoop)で構成されています。

Anacondaとは、PythonおよびPythonの主要なライブラリをパッケージ化したディストリビューションであり、 プログラミング言語の実行環境であるJupyter Notebookを含みます。

Sparkは分散処理用のソフトウェアであり、HDFSを使用した大規模データの分散処理が可能です。

GridData Analyticsの各製品は上記のソフトウェアをベースとし、 まずAnacondaに対してはユーザー管理機能であるJupyterHubや追加ライブラリを、 そしてJupyter Notebookに対しては実行可能なプログラミング言語を追加し、 また利便性を高めるために各ソフトウェアの機能や設定を追加・修正したものです。

なお、各言語のライブラリはインストール後に追加することができます。 詳細は Pythonライブラリを新規追加するRライブラリを新規追加する を参照してください。