GridData Analytics 管理者ガイド¶
本マニュアルは、以下の各製品のインストール、設定及び運用方法について説明したものです。 製品のご使用前に必ずお読みください。
- GridData Analytics Studio
- GridData Analytics Server
- GridData Analytics Scale Server
本書に記載されている外部URLについては2017年10月時点のものとなります。
GridData Analyticsの各製品(GridData Analytics Studio、GridData Analytics Server、 GridData Analytics Scale Server)のソフトウェア構成図は下図の通りです。
各製品は、Anaconda、Spark(Apache Spark)、HDFS(Apache Hadoop)で構成されています。
Anacondaとは、PythonおよびPythonの主要なライブラリをパッケージ化したディストリビューションであり、 プログラミング言語の実行環境であるJupyter Notebookを含みます。
Sparkは分散処理用のソフトウェアであり、HDFSを使用した大規模データの分散処理が可能です。
GridData Analyticsの各製品は上記のソフトウェアをベースとし、 まずAnacondaに対してはユーザー管理機能であるJupyterHubや追加ライブラリを、 そしてJupyter Notebookに対しては実行可能なプログラミング言語を追加し、 また利便性を高めるために各ソフトウェアの機能や設定を追加・修正したものです。
なお、各言語のライブラリはインストール後に追加することができます。 詳細は Pythonライブラリを新規追加する や Rライブラリを新規追加する を参照してください。