DIGITAL T-SOUL

Vol.20 IoTデータの価値を見いだす人工知能  アナリティクスからディープラーニングへ

このページを印刷する

#03 スマートコミュニティセンターで検証スタート IoTへのディープラーニングの適用を実用化する、新たな並列分散学習技術 株式会社東芝 インダストリアルICTソリューション社 IoTテクノロジーセンター ディープラーニング技術開発部 参事 高野 俊也

IoT*により収集される膨大なデータの分析に、ディープラーニングを活用する。
そのためには、データから学習モデルを高速かつ高精度で構築し、お客さまの状況に即応した分析環境の提供と、現場へのフィードバックを実現していくことが必要です。しかし従来の並列分散学習技術では、データの大規模化に対応するために計算ノード数を増やせば増やすほど計算効率が低下するという課題がありました。東芝は長年、画像・音声などの分野で培ってきたディープラーニングの技術やノウハウに、デル テクノロジーズ グループのDell EMCの高速ストレージ技術を融合させた、高速並列分散学習技術を開発。これを基盤に据えた高速ディープラーニングテストベッドがIndustrial Internet Consortium(IIC)で承認されたことを契機に、東芝のスマートコミュニティセンターにおいて「IoTへのディープラーニングの適用」を実用化する検証をスタートさせています。

* IoT:Internet of Things(モノのインターネット)

見えてきた、従来の並列分散学習技術の限界

従来の分析手法や推論に比べて格段に高い精度を実現するディープラーニング。インダストリアル領域でIoTデータの活用に役立てることにより、製造ラインの制御や社会インフラの安定稼働、ビル・ファシリティーの最適化などに迅速な判断や新たな知見をもたらすことが期待されています。しかし、高度な学習能力を誇るディープラーニングは一方で、その学習過程においてコンピュータに多大な計算負荷をかけてしまいます。センサーやカメラから絶え間なく送られてくる多種多様な時系列データから学習モデルを構築して、優れた洞察を導くまでに多くの時間を要するようでは、インダストリアル領域でのディープラーニングの活用は難しくなります。たとえば、膨大なセンサーデータから変化の要因を特定し、安定化の対策を見極めることに時間がかかっては、その分析が済んだときには既に状況が変化し、対策が役に立たず、結局は時間やお金、信頼が失われてしまうかもしれません。インダストリアル領域でディープラーニングを実用化するには、大規模なデータを対象としながら、学習モデルを高速かつ高精度で構築し、お客さまのニーズや状況に即応した分析環境の提供と現場へのフィードバックを実現していくことが必須です。

この課題を解決するために用いられている最も一般的な方法が「並列分散学習」と呼ばれるディープラーニングの高速化手法です。一台のコンピュータでは膨大な時間がかかる大量データの学習を、イーサーネットなどでつながれた複数のコンピュータで並列に実行。計算にかかるCPUやGPUの演算負荷を分散することで、全体の処理時間を短縮し、学習の高速化を図っていきます。

「IoTへのディープラーニングの適用」を掲げ、東芝では早くから技術開発に取り組み、各種シミュレーションと試行錯誤を繰り返してきました。その中で従来型の並列分散学習環境におけるボトルネックを発見したのです。

このページのトップへ

コンピュータをつないでも、
ディープラーニングの学習が速くならない

図1は、東芝のスマートコミュニティセンター(ラゾーナ川崎東芝ビル)において時系列で蓄積される3万種類以上のセンサーデータ1年分に対し、従来の並列分散学習によるディープラーニングを適用した場合のパフォーマンスをシミュレーションしたものです。縦軸が1ノードを基準とした計算性能、横軸が計算処理を行う計算ノード(1ノードあたり4つのGPUを搭載)の数を表しています。ここで観測されたのが、処理速度は計算ノード数の増加に比例して直線的に上がっていくわけではなく、ある地点で頭打ちとなってしまう事実でした。コンピュータを40Gbのイーサーネットでつないだ場合、その変化は緩やかですが、1Gbのイーサーネットでは僅か2ノードでピークを迎えてしまう。これでは大規模なIoTデータを扱うインダストリアル領域において、ディープラーニングを活用するための学習モデルの構築、運用からフィードバックまでのサイクルを、効率的かつ効果的に実行することができません。

図1 学習モデルをイーサネット経由で転送する従来の並列分散学習技術

並列分散学習においては、各コンピュータで学習した学習モデルを統合し、更新するために、パラメーターサーバーとそれ以外のコンピュータ間でデータのやりとりが頻繁に行われます。大規模なデータに対応するために計算ノードの数を増やせば増やすほど、計算ノード間でやり取りされるデータ量が増加し、通信帯域の制約からシステム全体の効率ダウンにつながってしまいます。東芝ではこの通信上のオーバーヘッドが計算効率を低減させる大きな原因と捉え、並列分散学習のボトルネックを解消する新たなシステムの模索を始めました。

このページのトップへ

オールフラッシュストレージを基盤に据え、
高速な並列分散学習環境を開発

高野 俊也

IoTで時系列に集まる大規模かつ多種多様なデータを、ディープラーニングで効率よく分析する。その実現は、従来の並列分散学習のボトルネックを解消し、学習する速度を計算ノード数の増加に応じて向上させることができる新たな仕組みを生み出せるかどうかにかかっていました。そこで東芝が着目したのがデル テクノロジーズ グループのDell EMC(以下、Dell EMC)の高速オールフラッシュストレージでした。このストレージは、NAND型フラッシュメモリを超高密度に搭載することで大容量化を実現するとともに、バックプレーン最大100GB/sの広帯域を複数のコンピュータと専用線でつなぐことで高速アクセスを実現し、企業や社会インフラのミッションクリティカルなシステムを支えるに相応しい高速性と信頼性を誇っています。

東芝では各コンピュータのイーサーネット接続に代えて、このストレージを各コンピュータ間でやり取りする学習モデルの共有ストレージとして活用(図2)。高速アクセスにより、学習モデルを同期、更新するオーバーヘッドの少ない、高速・高効率な並列分散学習環境を構築することを目指しました。

図2 学習モデルを高速ストレージで共有する新たな並列分散学習技術

図2のグラフは東芝のスマートコミュニティセンターと同じ大規模データの条件で、高速ストレージを基盤に据えた場合の計算ノード数と処理速度との関係のシミュレーション結果です。9ノードまでは飽和することなく直線的に処理速度が上がり、ピークを越えた10ノードの時点でも約10%のパフォーマンスダウンで済むことが観測されました。この結果から私たちは、東芝のディープラーニング技術に加え、Dell EMCの高速ストレージを活用した並列分散学習なら、インダストリアル領域の大規模なデータに対してもリアルタイムに近い推論と現場へのフィードバックが十分可能であるという大きな自信を得たのです。

このページのトップへ

IICテストベッドに承認
スマートコミュニティセンターで検証開始

高速・高効率な並列分散学習を実現し、大規模なIoTデータにディープラーニングが適用できることを確認した東芝では、Dell EMCと共同でIndustrial Internet Consortium(IIC)に大規模データに対応した高速ディープラーニングテストベッド(実証用の場)「Deep Learning Facility」を提案し、2016年10月に承認を受けました。インダストリアル領域におけるIoT活用のデファクトスタンダードを推進する国際的な団体であるIICが、ディープラーニングを活用したテストベッドを承認したのは今回が初めてです。

この決定を受け、東芝とDell EMCは、東芝のスマートコミュニティセンターにおける「Deep Learning Facility」の検証をスタートさせました。ビルの管理システムや空調機器、セキュリティゲートなどに付属したセンサーから室内環境や使用電力、人の入退館といった数万種類の規模の時系列データを集め、高速ストレージを活用した並列分散学習により学習モデルを高速に構築。ディープラーニングで高精度に推論し、機器の運用効率化や故障の予兆などを現場へと速やかにフィードバックしていくことで、センサーや監視機器などのメンテナンスの最適化や、設備の稼働率の向上を図りながら、IoTプラットフォームにおけるディープラーニングの有用性を検証しています。

検証は2017年9月まで行う予定です。東芝とDell EMCだから生み出せた新たな並列分散学習技術が、IoTへのディープラーニングの適用を実現化する多大な成果を生み出してくれることを期待しています。そして両社の取り組みの先には、ビル・ファシリティーや製造現場、社会インフラの効率的な管理や制御を可能にするベストプラクティスやソリューションの確立など、インダストリアル領域におけるディープラーニングの新しい夢が広がっていると信じています。

※この記事に掲載の、社名、部署名、役職名などは、2017年2月現在のものです。

関連記事Vol.20:IoTデータの価値を見いだす人工知能 −アナリティクスからディープラーニングへ

このページのトップへ