1. 更新履歴

  • V1.3 (2018/9)

    • Apache Hadoopのバージョンを2.7.6に変更しました。
    • Apache Sparkのバージョンを2.3.1に変更しました。
    • Apache Hive 2.3.3に対応しました。
    • データ管理・編集用WebアプリケーションのLake Studioを追加しました。以下の機能を利用できます。
      • データ管理機能
        GUI上から、HDFS上のファイルを管理できます。また、HDFS上のファイルやGridDB上のコンテナに対してテーブルを定義でき、そのテーブルを管理できます。
      • データ編集機能
        GUI上から、テーブルに対するSQLステートメントを記述・実行できます。また、保存したSQLステートメントを定期的に実行するスケジュールを定義、管理できます。
      • データエクスポート機能
        GUI上から、GridDB上のコンテナを外部のRDBにテーブルとしてエクスポートできます。
      • Lakeアカウント管理機能
        GUI上から、Lake Studioを利用するためのLakeアカウントを作成、管理できます。
    • GridDB接続機能が対応するGridDBのバージョンを4.0.2以上に変更しました。
    • GridDB Java APIライブラリーのバージョンを4.0.3に変更しました。
    • 動作保証範囲のCPU、メモリ、ディスクの要件を変更しました。
    • 注意事項・制限事項を変更しました。
  • V1.2.1 (2018/5)

    • 動作保障対象のOSをRed Hat Enterprise Linux / CentOSの6.9、7.4に変更しました。
    • GridDB接続機能が対応するGridDBのバージョンを4.0.2に変更しました。
  • V1.2 (2018/3)

    • Embulkのレジューム機能に対応しました。
    • Red Hat Enterprise Linux / CentOS 7.3に対応しました。
  • V1.0 (2017/12) 新規リリース

    • データ収集機能
      ログ収集ツールFluentdやEmbulkから送信されたデータを受信して、ストレージ領域に蓄積することができます。
    • データ蓄積機能
      ファイルストレージとして分散ファイルシステムHDFSを利用できます。また、分散NoSQLデータベースGridDBと連係して、構造化データを大量に蓄積することができます。
    • データ編集機能
      並列分散処理基盤Sparkを利用できます。ScalaやPythonで記述したSparkアプリケーションを実行し、HDFSやGridDBのデータを編集することができます。