sea-turt1e
近年、RAG(Retrieval-Augmented Generation)は企業内データ活用の定番手法となりました。しかし従来RAGは、複雑な関係性をもつデータを十分に活かせないという課題もあります。
本セッションでは、グラフデータベースとLLMを組み合わせた新しいアプローチ「GraphRAG」を、独自に構築した漫画データベースを例に紹介します。
RAGは、社内文書や固有の知識をLLMに活用するための技術として一般化しましたが、多くは非構造化データのベクトル検索や単純なキーワード検索に依存しています。そのため「データ同士の複雑な関係性」を扱うには限界があります。
これに対し、GraphRAGはグラフデータベースを活用し、ノードやエッジを通じて知識を構造化してLLMに渡すことで、より豊かな文脈を反映した出力を実現できます。
本セッションでは、「メディア芸術データベース」を活用してPythonで構築した漫画のレコメンドシステムを題材に、GraphRAGの仕組みを解説します。 漫画、作者、雑誌、連載時期といった多様な要素をグラフ構造で表現し、それらをLLMに渡すことで、従来のRAGでは困難だった自然で精度の高い生成を可能にした事例を紹介します。
デモサイトもご覧いただけるよう準備していますので、ぜひポスターにお立ち寄りください。
自社内などでRAGを使用する場面はここ数年増加したものの、従来のRAGでは十分な効果が得られないケースも多いと感じています。 その解決策の一つとして、同じ悩みを抱えた方に向けて共有できればと思い、この題材を選びました。
GraphRAGの基本概念
LLMの使用経験
プロフィール
普段は主にAI関連の実装や、研究開発分野の業務に携わっています。 また個人では自然言語処理関連のライブラリやグラフ関連アプリの開発を行っています。
ポートフォリオサイト: https://sea-turt1e.github.io/