重複レシピの投稿ユーザーを検出するシステムを楽天が開発、AIの活用も

クックパッドや楽天レシピなど、ユーザーが自由に投稿した料理レシピをまとめたレシピランキングサービスがよく利用されています。




レシピといえば、以前はレシピ本などの書籍を購入して探すものでしたが、近年は主婦層や独り暮らしの学生などを中心に、レシピサイトを利用して料理を作ることが多くなりました。

一般のユーザーが作成したレシピということもあって、比較的料理しやすいレシピが多いことや、手持ちの食材から検索できるため「いま食べたいもの」「いま作ることができるもの」を手軽に探せることがメリットです。

しかし、検索結果の一覧を見たときに、ほとんど違いのないレシピが並んでいてゲンナリしたことはないでしょうか。これらのレシピサイトの利便性は、検索したときに多様なレシピが得られることで確保できるものです。

ところが実際には、同一ユーザーが「重複投稿」を行っていることがよくあります。このような「重複レシピ」は、本質的には同じレシピであるのに中身を「少しだけ」変更したレシピです。

重複レシピはレシピランキングサービスの質そのものを低下させてしまう危険性があるため、サイト運営者としては効率的に検出して、なるべく排除していくことが望ましいと考えます。

そこで、楽天レシピを運営する楽天株式会社は筑波大の研究グループと共同で、重複レシピを自動検出するシステムを開発しました。

重複レシピを検出する手法

研究では、まず前提として短期間に多数のレシピを投稿したユーザーを、重複レシピの投稿ユーザーであるとみなしました。

次にこのユーザーが投稿したレシピと、それ以前にこのユーザーによって投稿されたレシピとの類似度を計算します。

そして「類似レシピ」を多数投稿したことが判明したユーザーを「重複レシピ投稿ユーザー」とみなして検出する方法を開発しました。

この手法について実験したところ、料理手順を記載したテキスト部分の類似度、そして料理画像の類似度を組み合わせた方法によって、重複レシピユーザーを高精度で検出できることが確認されました。

実験の結果、実際に短期間に多数のレシピを投稿したユーザーほど重複レシピを投稿するケースが多いことも実証されています。

今後の展開について

楽天レシピでは、今回の研究結果を実際のサイトに応用して、より独創性の高いレシピを上位にランキングできるようなシステムにしていくことも検討するとしています。

また、最新のディープラーニングの技術を活用して、さらに検出精度の高いシステムの構築も目指すとしています。

また、今回のシステムは重複レシピを投稿するユーザーを特定するシステムそのものです。

ユーザーの中には、レシピの投稿記事を作成する手間を省くために、以前に投稿したレシピの中身を一部だけを変更したレシピを投稿するケースがあります。

そのため、このようなユーザーが投稿したレシピは低品質であるとみなすことが可能であることから、積極的にこれらのレシピを検索結果から排除するシステムにしていく可能性が考えられます。

IMAGE1SOURCE1
NEW POST