東芝デジタルソリューションズ株式会社 本文へジャンプ

ヘルプ 別ウィンドウで開きます

導入事例

  • 最新導入事例
  • 一覧から選ぶ
  • お問い合わせ

導入事例 マツダ株式会社

Innovation Report / 年間約40万件ずつ増える膨大な特許情報を高速レスポンスでストレスなく検索

この事例紹介記事をPDFでダウンロード
[PDF形式/922KB]

Get Adobe ReaderPDFファイルの閲覧には、Adobe® Reader™が必要です。ダウンロード(別ウィンドウで開きます)してご覧ください。



選定ポイント

テラバイト級の大容量データを
サーバ1台で高速検索

【写真】ITソリューション本部 先行IT調査チーム リーダー 赤井 貴裕 様
ITソリューション本部
先行IT調査チーム
リーダー
赤井 貴裕 様

実は当初、先行IT調査チームは東芝ソリューションの『TX1』ではなく、別のベンダーの製品を導入するつもりだった。しばらくは、その製品で話を進めていたが、やがてコストパフォーマンスの壁にぶち当たってしまう。先行IT調査チームリーダーの赤井貴裕氏は、当時の問題点を次のように明かす。

「特許庁はオンメモリーのデータベースを活用していると聞いていたので、当初は弊社も同様の構成で製品を導入しようと考えていました。ところが、その製品ではサーバ1台あたり2ギガバイトしか対応できず、テラバイト級のデータを高速で検索しようとすると、10台前後のサーバが必要になる計算に。特許情報検索システムで想定される利用頻度を考えると、それでは投資対効果の点で疑問が残るし、先行評価としては大がかりになりすぎます。一度はXMLデータベース導入を断念して、知的財産部さんに頭を下げにいこうかと覚悟したくらいでした」

テラバイト級のデータを、コストパフォーマンスに優れた形で運用できるXMLデータベースはないか。その視点で再度検討したところ、3社の製品が浮上した。その中でも赤井氏が注目したのは東芝ソリューションの「TX1」だった。

「『TX1』との最初の出会いは、Webで見た東芝ソリューションさんの『TX1』の製品紹介記事でした。8年分の特許データ約300万件(約100GB)を、約1秒で検索できたという(3GHzのXeonプロセサを2個、メモリー2GBを搭載したサーバを使用した場合)を拝見し、それこそ弊社が目指しているシステムでした。すぐに東芝ソリューションさんに連絡を取って、それから2カ月かけて他社製品と比較検討。最終的に10月に導入を決定しました」

具体的に高く評価したのは、XMLのもとになったフォーマットであるSGML文書をXMLに変換して取り込む機能を、東芝ソリューションが提供していた点だった。SGMLをはじめ、さまざまなデータ形式をXML変換して登録するデータ連携機能がないと、フォーマットの変換が開発案件として追加され、開発工数が増えて手間もコストも余計にかかることになる。予算が限られている先行調査において、これは大きなポイントの1つだった。

またスピードが具体的な数値で提示されていることも好印象だったという。

「事前に数値が提案されず、作ってみなければわからないというのでは、こちらも不安でゴーサインを出しづらい。その点、東芝ソリューションさんは、このクラスのサーバならこのスピードが期待できるという数値をしっかり提案してくれたので、安心してお任せすることができました」(赤井氏)

【図】大容量データでも高速検索が可能なXMLデータベース[図をクリックして、拡大図を別ウィンドウで見る]

開発ポイント

Sun社の低価格な8コア搭載のサーバを活用して
膨大なデータを効率的に検索

導入作業は06年11月から着手した。大変だったのは特許情報の入力作業だ。

計画当初、RDBに入っているデータをXMLに変換し登録する予定であったが、レスポンスを軽くするために、クルマづくりに関連の薄い部分を間引いた特許情報しか入っていなかった。それをコンバートするのは容易だが、本来ならば、クルマづくりにわずかでも関連する可能性のある特許情報を網羅的に登録することが望ましい。そこで今回のシステム構築を機に、遺伝子関連の特許などごく一部の特許情報を除いて、ほぼすべての特許情報を新たに登録し直すことを決断。特許庁が毎週約5,000件ずつ公開する特許情報を収めたCD-RやDVDなどのメディアから、新しいデータベースに直接入力することにした。

「メディアの量は、段ボール6箱分にのぼりました。入力作業は当社で行ったのですが、仕事の合間に入力していたため、この作業だけで1カ月以上費やしてしまいました」(赤井氏)

ただ、システムの構築そのものは非常にスムーズだった。その要因としては、「TX1」を製品開発したスタッフがサポートとして入ったことがあげられる。

「『TX1』自体は1つのXQueryでパラレルに検索する機能を持っていない製品でしたが、特許情報を1年ごとにパラレルに検索できるようにしたいとの要望に対し、そのカスタマイズはけっして簡単ではなかったはずです。しかし、製品を熟知した開発の方が入ってくれたおかげでスムーズに導入ができました。この点は実に心強かったですね」(赤井氏)

こうして07年1月末には、データの入ったプロトタイプが完成。そこから同社のノウハウを反映させる作業に入った。

実は特許情報の検索には、特殊なスキルが必要になる。というのも、特許には一般名詞ではなく特許の専門用語が使われるケースが多いからだ。例えば一般的に使われる「サスペンション」という単語は、専門用語では「懸架装置」と呼ばれる。そのためそのまま「サスペンション」とだけで検索するのは不十分である。

特許の専門用語の知識がない開発者でも容易に使えるようにするには、一般名詞と専門用語を関連付ける独自のノウハウをシステムに反映させる必要がある。特許情報を検索できる一般向けのASPサービスもあるが、それを開発者向けにあえて導入しないのも、同社の知的財産部が蓄積してきたそのノウハウをシステムに反映できないためだ。

自社開発の以前のシステムには、同社独自のノウハウが反映されていた。その利点を活かすために、今回も以前のシステムを引き継ぐ形でカスタマイズを実施。2月末には、マツダ独自のノウハウが詰まった特許情報検索システムが完成し、3月から社内の開発者向けに公開を始めた。

前を読む 続きを読む

このページのトップへ
Copyright