2つの文書をAIで比較して内容の違う部分を自動で見つけ出す「ディープアライメント」

別に作成された2つの文書を比較して同じ内容の部分と違う内容の部分を自動で判別できる、人工知能(AI)を活用した新しい自然言語処理技術をリコーが開発しています。

この技術では、構成の違った2つの文書の内容を比較して、文や段落を自動的に対応させて重複や差異を明らかにするAIを使っており、「ディープアライメント」と命名されました。




リコー

たとえば、異なる2会社でかわす契約書をチェックする際に、それぞれの会社で作成された内容を比較する必要があります。

2種類の契約書を比べて同様の内容を述べている部分や余分に含まれている内容を一目瞭然とすることができるため、文書のチェック時間を大幅に短縮することが可能になります。

「ディープアライメント」では、深層学習によって語句の意味はもちろんのこと、語句が属している文や段落の意味の近さも考慮します。

それらの文や段落が文書内で出現する順序が違っていても、それらを対応づけるアルゴリズムが考案されており、より一般的な文書の対応づけに適用することに成功しました。

この技術を実際にリコーの法務部門で使ったところ、人手ではおよそ24時間も要する482条文の契約書について、わずか1分で対応づけを実行することができたとしています。従来のテキスト分類技術と比較したところ、2倍以上の対応づけの精度が得られました。

NEW POST