ニュースリリース

特許庁からの機械翻訳システムの受注について ~ NICTが開発した最新のニューラル機械翻訳エンジンの採用により、正確で自然な翻訳を実現 ~

2018年7月10日

東芝デジタルソリューションズ株式会社

 東芝デジタルソリューションズ株式会社(以下、当社)は、特許審査官を始め、国内外の企業、研究機関が利用する「機械翻訳システム」を特許庁から受注しました。国立研究開発法人情報通信研究機構(NICT)先進的音声翻訳研究開発推進センターが開発した最新のニューラル機械翻訳エンジン注1(NMT)に当社が持つ自然言語処理技術を組み合わせることで、従来の機械翻訳では難しかった正確で自然な機械翻訳を実現します。さらに、日本マイクロソフト株式会社(マイクロソフト)のクラウドプラットフォームMicrosoft Azureを採用することで大量の特許文献に対して高速の翻訳処理を可能にします。本システムは2019年5月からの稼動を目指し開発を開始します。

 特許戦略のグローバル化に伴い、特許文献を翻訳する頻度・件数は急増しています。しかし、従来の人手による翻訳作業では、時間がかかる、コストが高い、大量の翻訳が難しいなどの課題がありました。これらの課題を解決する手段として、機械翻訳の活用が進んでいますが、従来のルールベース機械翻訳エンジン注2(RBMT)や統計的機械翻訳エンジン注3(SMT)では、正確さや自然さに欠けるなどの問題がありました。近年になり、人工知能(AI)を活用したNMTの登場で、翻訳品質は格段に向上しましたが、原文のパターンによっては誤訳(訳抜け、湧き出し注4等)が生じやすいなどの欠点が指摘されています。
 また特許文献は、内容が長文で記載される請求項部分注5と、句から構成される「発明の名称」「出願番号」「出願人」の定型部分が同一文書内に含まれ、請求項部分にはNMTが適している一方、定型部分はRBMTやSMTが適するなど翻訳エンジンの向き・不向きが混在しているという課題がありました。

 今回当社が開発する特許庁「機械翻訳システム」は、当社が長年培ってきた自然言語処理技術に、NICTが開発した最新のNMTを組み合わせることにより、以下のような処理を可能にします。
 当社の自然言語処理技術で、特許文献の請求項部分と定型部分を自動で切り分け、NMT、RBMT、SMTに適宜振り分けます。加えて、NMTの弱点とされる誤訳が生じにくいように入力文を整形する処理技術を実装します。これらにより、NMTの翻訳性能を最大限に活かした正確で自然な翻訳を実現することが可能になります。
 また、大量の特許文献を高速に翻訳処理するために、高速・同時・大量の処理が可能なクラウドプラットフォームMicrosoft Azureを採用します。

 当社は今後も、NICTおよびマイクロソフトと連携し、高品質の機械翻訳ソリューションの開発・改良を続け、グローバル化の進展に伴い高まる、企業、研究機関・官公庁の翻訳ニーズに応えるソリューションを提供していきます。

原文 前記複数のサーバ装置のうちの1つを前記マスターのサーバ装置に設定する調停装置をさらに備え、前記クライアント装置は、送信した前記操作情報に応じた変更が成功しなかった場合、前記調停装置から通知された前記マスターのサーバ装置に同一の前記操作情報を再送信する 請求項5に記載のデータベースシステム。
正解訳
(人手翻訳)
The system according to claim 5, further comprising an arbitration device configured to set one of the plurality of server devices to the master server device, wherein the client device retransmits the same operation information to the mastar server device notified from the arbitration device when the change of the database according to the transmitted operation information is not successful.
NICT-NMT The database system according to claim 5, further comprising an arbitration device configured to set one of the plurality of server devices to the server device of the master, and wherein the client device retransmits the same operation information to the server device of the master notified from the arbitration device when the change corresponding to the transmitted operation information is unsuccessful.

翻訳例1 : 日本特許公報 請求項部分の日英翻訳

原文 根据权利要求1所述的电车控制装置,其特征在于,所述电车中的多个车辆各自设置有所述滑动控制部,在一个所述滑动控制部将所述阈值从所述第一阈值切换到所述第二阈值的情况下,其他的所述滑动控制部也将所述阈值从所述第一阈值切换到所述第二阈值。
正解訳
(人手翻訳)
前記電気車における複数の車両ごとに前記すべり制御部が設けられ、 1つの前記すべり制御部が、前記閾値を前記第1閾値から前記第2閾値に切り替えた場合、他の前記すべり制御部も、前記閾値を前記第1閾値から前記第2閾値に切り替える、請求項1に記載の電気車制御装置。
NICT-NMT 前記車両の複数の車両それぞれに前記スライド制御部が設けられ、一方の前記スライド制御部が前記閾値を前記第1の閾値から前記第2の閾値に切り替える場合、他の前記スライド制御部も前記閾値を前記第1の閾値から前記第2の閾値に切り替えることを特徴とする請求項1記載の電車制御装置。

翻訳例2 : 中国特許公報 請求項部分の中日翻訳

特許庁「機械翻訳システム」の主な特長

  • 書類・日本特許公報の翻訳機能:日本語→英語
    主な用途:海外庁審査官及び海外企業、海外研究機関が日本特許公報や審査状況を調査する際に利用
  • 中国特許公報、韓国特許公報翻訳機能:中国語→日本語、韓国語→日本語
    主な用途:国内企業や研究機関が中国・韓国で出願された特許を検索、内容を把握するために利用
  • NMTによる正確で自然な機械翻訳を実現
  • 特許文献の内容に応じて翻訳エンジン(NMT、RBMT、SMT)を切り替え
  • 入力文の整形処理によりNMT特有の誤訳を改善
  • 注1 ニューラル機械翻訳 Neural Machine Translation(NMT):深層学習(ディープラーニング)技術を用いた機械翻訳
  • 注2 ルールベース機械翻訳 Rule Based Machine Translation(RBMT):辞書・文法知識に基づく機械翻訳
  • 注3 統計的機械翻訳 Statistical Machine Translation(SMT):対訳コーパスの統計情報に基づく機械翻訳
  • 注4 訳抜け:原文にある情報が、翻訳結果から抜け落ちる現象
    湧き出し:原文に無関係な用語が、翻訳結果に出現する現象
  • 注5 請求項部分:特許権を請求する内容を記載した部分

関連情報

国立研究開発法人情報通信研究機構 プレスリリース
https://www.nict.go.jp/press/2018/07/10-1.html
日本マイクロソフト株式会社 マイクロソフト公式ブログ
https://aka.ms/toshibad2018

以上