|
|
自然言語処理機能の搭載で検索性能を向上した |
||
|
||
東芝ソリューション株式会社(本社:東京都港区、取締役社長:梶川茂司)は、自然言語処理機能の搭載で検索性能(精度と速度)を向上し、さらにRDBやNotesなど様々な形式のデータをXML形式に変換し登録する機能を搭載した、XMLデータベース TX1の新バージョンV2を商品化しました。本商品をコンテンツ管理システムやデータ統合システムに向けて本日から販売開始します。 柔軟なデータ構造を持つXMLは、電子取引などインターネット上での様々なデータ交換システムに適用されるだけでなく、新しい分野に適用の幅を広げています。ひとつは、ドキュメントや電子メールといった非定型データをXML形式で表現し管理する「コンテンツ管理システム」です。もうひとつは、システムごとにRDBやNotesなどで個別に運用されているデータをXML形式に変換し、システムをまたがった一元的な検索や分析を可能にする「データ統合システム」です。これらのシステムのデータベースとして、XMLの持つ柔軟性をそのまま活かせるXMLデータベースが注目されています。 これらのシステムをXMLデータベースで構築する場合、「大量のデータでも高速に検索できること」、「必要な時に必要なデータを素早く見つけ出す検索手段を備えていること」、「さまざまな形式のデータでもXMLデータとして扱えること」などの要件がXMLデータベースには求められます。 今回商品化するTX1V2は、テラバイト級の大容量データでも高速に検索できる従来からの特長に加え、コンテンツ管理システムやデータ統合システムに適した2つの機能を新たに搭載したものです。1つめは、単語の意味に着目した検索で、探したいデータのより素早い抽出を可能にする「自然言語処理機能」です。2つめは、RDBやNotesなど様々な形式のデータをXML形式に変換しTX1に登録する「データ連携機能」です。それぞれの機能の具体的な特長は次のとおりです。 <自然言語処理機能> <データ連携機能>
|
||
![]() 図1.Nグラム方式と形態素解析方式のXMLの要素単位での使い分けの例 ![]() 図2.データ連携機能を活用したデータ統合システムの例 |
||
| ニュースリリースに掲載されている情報(価格/仕様、サービスの内容及びお問い合わせ先など)は、発表日現在の情報です。予告なしに変更されることがありますので、あらかじめご了承ください。 |





