傳統 RAG 在處理長文本時常因檢索片段零散而失去脈絡,來自 Stanford 的 RAPTOR 技術透過「多層語意樹」,讓 AI 能同時掌握主題與細節,實現更完整的檢索與生成,它具備長文本友好、脈絡完整、檢索策略靈活等優勢,特別適用於企業知識庫、長篇報告分析與專業內容服務,未來更有望成為智慧搜尋與知識管理的核心技術。
近年來,檢索增強生成(RAG, Retrieval-Augmented Generation) 成為提升 AI 回答準確度的關鍵技術,但傳統 RAG 在處理長文本時常遇到瓶頸:檢索結果多半是零碎片段,缺乏上下文脈絡,導致生成內容斷裂或語意跳躍。
為了解決這個問題,來自 Stanford 的研究團隊提出 RAPTOR(Recursive Abstractive Processing for Tree-organized Retrieval),它透過「多層語意樹」結構,讓 AI 不僅能讀懂片段,更能同時掌握主題與細節,在長文本檢索中展現突破性的效果。
RAPTOR 是一種改良版的 RAG 方法,其核心在於分層理解長文本,流程如下:
這就像把一本厚書先劃分成章節與小節,再為每一層撰寫摘要,最終組成一棵完整的語意樹。
RAPTOR 在檢索時提供兩種模式:
與傳統 RAG 相比,RAPTOR 的優勢在於:
未來可研究方向:
RAPTOR 的價值不僅在於能「找到」資料,更在於真正「理解」資料結構與脈絡。
對企業而言,應用場景廣泛:
RAPTOR 代表了檢索技術的新一階段,透過「多層語意樹」,它能讓 AI 不只停留在片段檢索,而是同時掌握主題脈絡與細節內容,未來,RAPTOR 有望成為企業知識管理與智慧搜尋系統的核心技術,推動 AI 從「被動查找」走向「主動理解」。