人とシステム

季刊誌
NTTデータエンジニアリングシステムズが発行する
お客さまにお役に立つ情報をお届けする情報誌です。

No.112 | システム紹介
検索拡張生成(RAG)の概要・事例紹介
株式会社NTTデータエンジニアリングシステムズ
新事業企画室 DX推進部 開発課
石渡 聖矢

はじめに

近年、企業のデジタルトランスフォーメーション(DX)が加速する中、効率的な情報検索の重要性が高まっています。特に注目を集めているのが、生成AIの精度向上を図ることで正確性の高い情報入手を可能とする「検索拡張生成(RAG:Retrieval-Augmented Generation)」です。本稿では、そのRAGについての概要やメリット、私たちにおけるサポート業務への活用についてご説明します。

RAGの概要

生成AIは、人間のような自然な会話が可能であり、文書の要約や翻訳などのさまざまなタスクを遂行する汎用性を持っています。ただし、必ずしも正確な回答が得られるわけではありません。それは、生成AIの基盤となる大規模言語モデル(LLM:Large Language Models)が、事前に学習したデータベースを基に統計的な回答を生成するため、データベースに含まれていない情報は回答できないからです。しかし、ビジネスの現場では、自社の社内情報や最新情報から検索したいというニーズが高まっています。

RAGは、LLMによる回答の生成に外部情報の検索を組み合わせることで回答精度の向上を図ることができる手法です。RAGを活用すると、検索範囲を社内情報や最新情報に広げることができ、正確な回答の生成が可能となります。

実際のRAGの仕組みは、検索段階で抽出器を用いて内部データやインターネット上の情報を検索し、その情報を統合して生成器が回答を作成する、という流れになります。これにより、従来のLLMの限界を克服し、高精度の回答が期待できます(図1)。

図1  RAGの仕組み
図1 RAGの仕組み

RAGを活用するメリット

RAG は、Patrick Lewis氏らにより2020年に概念が発表されて以降、急速な発展を遂げてテキストだけでなく音声や画像を対象とするマルチモーダルな領域へ拡張が進んでいます。RAGの活用に関する調査では、IT・通信業界が最も進み、その企業の半数以上は社内の利用から始められています。その理由の一つにRAGの魅力である情報更新が容易になることが挙げられます。最新データに基づいた信頼性の高い回答が得られるため、企業内部での意思決定にも強みを持つことができます。また、事実に基づかない回答を生成するハルシネーションの発生を低減でき、運用コストも抑えられるため、企業の競争力の強化に寄与します。

また、製造業でもRAGが重要な役割を果たしており、生産管理や製品開発において、過去のデータや故障情報をもとにリスクが予測できるというメリットがあります。例えば、プロジェクト関連の過去資料や社内データを容易に検索できるようにすることで、業務時間の大幅な短縮に成功している企業もあります。これは、担当者の不在や退職などで資料の特定が困難な場合にも有効です。また、社内の基幹システムとデータを連携させて、技術情報や顧客ニーズを即座に把握し、業務の効率化を進めている企業もあります。

このように、RAGは企業がデータを効果的に活用し、生成AIの真価を引き出す手法として注目されています。今後も、音声や画像を対象としたマルチモーダル領域へのさらなる拡張や、専門分野での活用が期待されています。

サポート業務にRAGを活用

事例として、私たちのお客さまからのお問い合わせに対するサポート業務にRAGを活用し、作業効率が大幅に向上した取り組みをご紹介します。私たちのサービス、ソリューションにおけるサポートでは、迅速かつ質の高い対応が求められています。そのため、サポートの担当者にはサービス、ソリューションの専門知識やスキルが必要とされますが、その育成には年単位の期間を要します。

従来のサポート業務の担当者は、お客さまよりお問い合わせがあると、次の3つのプロセスを行います。

①過去の問い合わせ情報からの事例を検索する。

②事例がない場合には、お問い合わせの現象から調査を実施する。

③調査結果を明確に分かりやすくお客さまへ回答する。

まず、アプリケーションごとに保存された社内のデータベースから、問い合わせに関連する事例を検索して情報を集めます。その際、検索結果が適合しないことがあり、その原因の一つに類似語や関連語を考慮するキーワードの設定の難しさがありました。その上、回答の作成でも、過去事例の回答を組み合わせることがより難しくなります。

そこで、担当者のスキルに関係なく迅速かつ効率的な対応を可能とするRAGの活用に取り組みました。RAGはこれらの課題を解決し、事例検索の迅速化を促進するとともに回答文章のフォーマットの統一を図り、経験の浅い担当者でも高品質なサポートを行うことができます。RAGで構築したLLMの事例検索では、過去の類似事例の効果的な検索を可能とし、より自然な文章でお客さまへの回答を生成する仕組みを実装することができました。これらは既にサポート業務の一部で運用を開始しています。

この新しい取り組みを、経験の浅い担当者が実際に試したところ、事例の検索時間が3分の1、回答の生成時間も4分の1にまで短縮できました。全体を通しても、専門知識や長年のスキルを有する担当者とほぼ同じ時間で作業ができ、作成した回答は概ね70%以上の類似度を維持しています。特に、インストールや操作方法に関する問い合わせの場合には、より高い類似度が確認されています(図2)。

図2  RAGの活用効果
図2 RAGの活用効果

以上のことから、RAGの活用により担当者のスキルに関係なく、お客さまにご満足いただける迅速かつ効率的な対応を可能としました。一方でサポートに従事しているすべての担当者が、社内のデータベースに過去の問い合わせを整理整頓しておくことの重要性を再認識したという、良い結果を得られました。

おわりに

近年、さまざまな業界で人材不足という社会問題が深刻化しています。少子高齢化や労働環境の変化により、専門的なスキルを持つ人材が減少傾向にある中、RAGは有望な解決策となるでしょう。特に、教育や研修に多くの時間を要する専門知識が必要となる業務の場合、担当者の経験を問わず質の高い業務を行える環境を整備できます。

今後は、このRAGの仕組みを社内外へも展開していく考えです。一方で、音声や画像といったマルチモーダル対応技術の導入も視野に入れ、RAGのトレンドに沿った革新的な取り組みも行っていきます。さらに、より柔軟で迅速な情報活用を追求し、社内のDXを加速させていきます。