東芝AI技術カタログ

  • 言語データ分析

類義表現抽出

複数単語の組合せ表現(n-gram)の意味の近さを定量化します。


  • n-gramの長さごとにネットワークを用意し、隠れ層から出力層にかけて接続することで、n-gramの長さごとの違いを考慮して重みを更新します。
  • n-gramの意味の近さを正確に捉えることで、大量の文書から効率よく所望の文書を見つけることができます。

応用先



  • 文書検索・分類システム

ベンチマーク・強み・実績



  • 従来手法に比べ、複数の単語同士の意味の近さを高精度に推定可能(言語処理学会第25回年次大会)

問い合わせ窓口



問合せの際はタイトル[東芝AI技術カタログ:類義表現抽出]やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。