1. 更新履歴¶
V1.3 (2018/9)
- Apache Hadoopのバージョンを2.7.6に変更しました。
- Apache Sparkのバージョンを2.3.1に変更しました。
- Apache Hive 2.3.3に対応しました。
- データ管理・編集用WebアプリケーションのLake Studioを追加しました。以下の機能を利用できます。
- データ管理機能
- GUI上から、HDFS上のファイルを管理できます。また、HDFS上のファイルやGridDB上のコンテナに対してテーブルを定義でき、そのテーブルを管理できます。
- データ編集機能
- GUI上から、テーブルに対するSQLステートメントを記述・実行できます。また、保存したSQLステートメントを定期的に実行するスケジュールを定義、管理できます。
- データエクスポート機能
- GUI上から、GridDB上のコンテナを外部のRDBにテーブルとしてエクスポートできます。
- Lakeアカウント管理機能
- GUI上から、Lake Studioを利用するためのLakeアカウントを作成、管理できます。
- GridDB接続機能が対応するGridDBのバージョンを4.0.2以上に変更しました。
- GridDB Java APIライブラリーのバージョンを4.0.3に変更しました。
- 動作保証範囲のCPU、メモリ、ディスクの要件を変更しました。
- 注意事項・制限事項を変更しました。
V1.2.1 (2018/5)
- 動作保障対象のOSをRed Hat Enterprise Linux / CentOSの6.9、7.4に変更しました。
- GridDB接続機能が対応するGridDBのバージョンを4.0.2に変更しました。
V1.2 (2018/3)
- Embulkのレジューム機能に対応しました。
- Red Hat Enterprise Linux / CentOS 7.3に対応しました。
V1.0 (2017/12) 新規リリース
- データ収集機能
- ログ収集ツールFluentdやEmbulkから送信されたデータを受信して、ストレージ領域に蓄積することができます。
- データ蓄積機能
- ファイルストレージとして分散ファイルシステムHDFSを利用できます。また、分散NoSQLデータベースGridDBと連係して、構造化データを大量に蓄積することができます。
- データ編集機能
- 並列分散処理基盤Sparkを利用できます。ScalaやPythonで記述したSparkアプリケーションを実行し、HDFSやGridDBのデータを編集することができます。