تولید مبتنی بر بازیابی (RAG)
مدلهای زبانی عمومی میتوانند تنظیم و بهتر بشوند تا کارهای معمولی مثل تحلیل احساسات و شناسایی نام موجودیتها رو انجام بدن. این کارها معمولاً نیاز به دانش اضافی ندارن.
برای کارهای پیچیدهتر و نیازمند دانش بیشتر، میشه یه سیستم مدل زبانی درست کرد که به منابع دانش خارجی دسترسی داشته باشه تا کارها رو انجام بده. این باعث میشه جوابهایی که تولید میشن، دقیقتر و معتبرتر باشن و مشکل “هذیانگویی ” hallucination رو کمتر کنه.
محققان هوش مصنوعی متا یه روشی به اسم Retrieval Augmented Generation (RAG) معرفی کردن تا کارهایی که نیاز به دانش زیاد دارن رو حل کنه. RAG یه بخش بازیابی اطلاعات رو با یه مدل تولید متن ترکیب میکنه. RAG رو میشه جوری تنظیم کرد که دانش داخلیش به شکل کارآمدی تغییر کنه، اونم بدون اینکه نیازی باشه کل مدل رو دوباره آموزش بدن.
RAG یه ورودی میگیره و یه سری اسناد مرتبط و پشتیبان رو از یه منبع (مثلاً ویکیپدیا) پیدا میکنه. بعد این اسناد رو به عنوان زمینه با ورودی اصلی قاطی میکنه و به یه مولد متن میده که خروجی نهایی رو بسازه. اینجوری RAG برای شرایطی که اطلاعات ممکنه با گذشت زمان تغییر کنن، خیلی منعطفه. این خیلی کاربردیه چون دانش مدلهای زبانی بزرگ (LLMs) ثابت و تغییرناپذیره. RAG به مدلهای زبانی این امکان رو میده که بدون نیاز به آموزش دوباره، به آخرین اطلاعات دسترسی داشته باشن و خروجیهای قابل اعتماد تولید کنن.
لوییس و همکارانش در سال 2021 یک روش تنظیم دقیق چند هدفه برای RAG پیشنهاد دادند. در این روش، از یک مدل seq2seq از پیش آموزشدیده به عنوان حافظه پارامتری استفاده میشود و از یک ایندکس وکتوری متراکم از ویکیپدیا به عنوان حافظه غیرپارامتری بهره گرفته میشود (که با استفاده از یک دریافتکننده عصبی از پیش آموزشدیده به آن دسترسی دارند).
RAG رو چندین معیار مختلف مثل Natural Questions، WebQuestions و CuratedTrec عملکرد قوی نشون داده. وقتی که روی سوالات MS-MARCO و Jeopardy امتحانش میکنیم، پاسخهایی که RAG تولید میکنه بیشتر واقعی، خاص، و متنوع هستن. RAG همینطور برای بررسی واقعیتها در FEVER هم نتایج بهتری به دست میاره.
این نشون میده که RAG میتونه گزینه خوبی برای افزایش خروجی مدلهای زبانی توی کارهای دانشمحور باشه. این روزها روشهای مبتنی بر بازیابی بیشتر محبوب شدن و با مدلهای بزرگ زبان مثل ChatGPT ترکیب میشن تا دقت و سازگاری اطلاعاتی رو بیشتر کنن.