東芝デジタルソリューションズ株式会社 本文へジャンプ

ヘルプ 別ウィンドウで開きます

導入事例

  • 最新導入事例
  • 一覧から選ぶ
  • お問い合わせ

導入事例 日本パテントデータサービス株式会社

Innovation Report / 月額固定の特許情報検索サービスに翻訳機能を追加 付加価値の増大で一層のシェア拡大を目指す

この事例紹介記事をPDFでダウンロード
[PDF形式/1.6MB]

Get Adobe ReaderPDFファイルの閲覧には、Adobe® Reader™が必要です。ダウンロード(別ウィンドウで開きます)してご覧ください。



選定ポイント

言語処理機能とAPIの使い勝手、
強力なサポート体制

JPDSでは、JP-NETに英日の自動翻訳機能を追加するにあたり、翻訳エンジンに東芝ソリューションの「The翻訳サーバ」を採用した。BSRという開発会社を持ちながら、外部ベンダーの製品を選択した理由は幾つかある。まず、BSRは検索アルゴリズムやASPサービスに十分な技術力を持っているが、とはいえ自然言語の自動翻訳はさらに別の分野の技術である。この技術の蓄積には、単に金銭的な投資だけでなく時間をかけた情報の蓄積も必要となる。東芝ソリューションの自動翻訳機能を採用した理由には、 1980年代、日本語ワードプロセッサ「TOSWORD」シリーズの日本語処理機能で培われ、脈々と続いている言語処理技術の高さもあるそうだ。

次に、翻訳システムが提供する外部インターフェイスの良さが挙げられるという。これについては、BSR 代表取締役社長の田代浩一氏が次のように話す。

「自動翻訳エンジンのAPIが、弊社の検索システムと相性が良く、HTTPベースのインターフェイスは非常に扱いやすいものでした。導入検討時のデモ版を評価したときは、およそ1週間でプロトタイプを構築できたほどです」

JPDSが翻訳機能を実装するにあたり、さらにこだわったのは機能面だけではない。前述の「誠実な情報提供」の理念はここでも生きており、翻訳のスピードと精度を優先させたという。自動翻訳機能は既存ユーザに追加の負担を強いることなく提供されるサービスだが、だからといっておまけ的な機能とはとらえていない。顧客満足度向上とより良いサービスのための投資と考え、翻訳の品質や操作性を犠牲にしていない。実際、ベンダーの選定時には破格のシステムを提案してきたところもあるそうだが、翻訳の質などを総合的に判断して東芝ソリューションに決定したそうだ。

選定についてはほかにも、自動翻訳エンジンのバージョンアップ、辞書のチューニングなどの対応、導入システムに合わせたカスタマイズなど、ベンダー側のサポート体制も重要視した。JP-NETの主要な機能の一つとして今後も長く展開していくため、パッケージやシステムの売り切り、サービスの提供のみという取引はできなかったと田代氏は言う。

開発ポイント

未知語のチューニングと拡張性

もともと、今回のシステム導入のきっかけは、紙によるデータ保存の限界であった。その点については、まさに劇的な改善が見られた。

「年間では6000〜7000件のお問い合わせがあり、1件につき最低でもA4用紙1枚を書き起こしていました。もちろん、1枚で足りるとは限りませんので、年間では約1万枚の用紙が必要だったのでJP-NETの英文特許情報の翻訳機能として東芝ソリューションの自動翻訳エンジンを採用することに決めたのは2009年8月。その前後にデモ版によるプロトタイプの製作やシステムの評価を行っていた。既存検索システムとの接続性や翻訳機能などに問題がないことを確認し、10月の「特許・情報フェア&カンファレンス」の会場で、翻訳機能追加を含むJP-NETの新バージョンの発表を行った。サービスインは同年の11月とアナウンスされ、実際にサービスが開始された。

つまり、自動翻訳エンジンの選定終了から実際のサービスインまで、わずか2カ月程度しかかかっていないことになる。しかも、サービスインの11月までの間に、社内での機能テストや改善点の洗い出し作業も行われた。Webアプリケーションとしてサービスされる機能とはいえ、異例の短期間開発が可能だった点には、前述したAPIの提供方法や接続性の良さによるところが大きいと見られる。

翻訳エンジンの機能やデータベースシステムとの結合作業に大きな問題が出なかったため、テストで明らかになった改善ポイントや表示フォーマットの調整、辞書の設定やチューニングといった作業を重点的に行うことができたという。

BSRの森田結実氏によれば、特許情報の自動翻訳で問題となるのが、業界や分野・分類ごとの専門用語と、未知語と呼ばれる、新しい技術用語、その研究や論文の中で作られた造語の扱いをどうするか、つまり辞書のメンテナンス、設定、チューニングである。これらについては、社内テストでもさまざまな事象が確認され要望も出された部分だそうだ。どの分野にはどのような辞書の組み合わせや設定が有効かを検証し、実際のサービスインに備えた。また、未知語が発見された場合の処理、情報の蓄積、辞書への反映といったチューニング作業も、ユーザの使い勝手やパフォーマンスへの評価に直結する要素として検討が行われた。

実際のユーザからのリクエストによる改修や改良、未知語による辞書チューニングは、これからも続く作業である。そのため、システムの拡張性や保守性も考えた開発を行った。

前を読む 続きを読む

このページのトップへ
Copyright