خودسازگاری Self-Consistency

شاید یکی از تکنیک‌های پیشرفته‌ی مهندسی پرامپت، “خودسازگاری” باشه. این روش رو وانگ و همکارانش تو سال ۲۰۲۲ پیشنهاد دادن. خودسازگاری رویکردیه که به سادگی از یک مدل یک پرسش را چندین بار می‌پرسد و نتیجه‌ غالب را به عنوان پاسخ نهایی در نظر می‌گیره. این رویکرد تکمیل‌کننده‌ی روش CoT است و در ترکیب با آن قدرتمندتر می‌شه.

حالا یک مثال ساده از آنالیز ایمیل‌ها رو بررسی می‌کنیم. فرض کنید شما یه شرکت نرم‌افزاری هستید و روزانه صدها ایمیل دریافت می‌کنید. شما می‌خواهید از یک مدل استفاده کنید تا ایمیل‌ها رو به دو دسته مهم و غیرمهم تقسیم کنید، تا بتونید ایمیل‌هایی رو که ممکنه تأثیر زیادی روی کسب و کارتون داشته باشه، اولویت‌بندی کنید.

پرامپت:

سلام

من یک آسیب پذیری امنیتی بزرگ در سیستم شما کشف کرده ام. اگرچه استفاده از آن آسان نیست، اما امکان دسترسی به تمام داده های کاربران شما وجود دارد. من یک نمونه‌ای برای اثبات وجود را پیوست کرده ام. لطفا هر چه سریعتر این مشکل را برطرف کنید.

با احترام،
دانی

ایمیل بالا را به عنوان مهم یا غیر مهم طبقه بندی کنید زیرا مربوط به یک شرکت نرم افزاری است. بیایید قدم به قدم فکر کنیم.

حالا از پرامپت بالا برای ایجاد چندین زنجیره تفکر جداگانه استفاده می‌کنیم. در اینجا چند نمونه آورده شده:

خروجی ۱:

فرستنده یک آسیب پذیری امنیتی بزرگ در سیستم کشف کرده است.
این مهم است زیرا می تواند منجر به نقض داده شود.
من این ایمیل را به عنوان مهم طبقه بندی می کنم

خروجی ۲:

فرستنده یک آسیب پذیری امنیتی بزرگ را در سیستم کشف کرده است، اما آنها هیچ مدرکی برای اثبات ارائه نکرده اند و استفاده از آن آسان نیست.
من این ایمیل را به عنوان غیرمهم طبقه بندی می کنم

خروجی ۳:

فرستنده احتمالاً یک هکر است و ممکن است به سیستم دسترسی داشته باشد.
این مهم است زیرا می تواند منجر به نقض داده شود.
من این ایمیل را به عنوان مهم طبقه بندی می کنم

می‌توانیم ببینیم که یک پاسخ اکثریتی در حال شکل‌گیری است که در واقع به عنوان پاسخ نهایی (مهم) خواهد بود.

با ایجاد زنجیره‌ تفکر و انتخاب پاسخ‌هایی که به طور مکرر ظاهر می‌شوند، می‌توانیم به پاسخی صحیح‌تر و با ثبات از مدل زبانی دست یابیم.

خودسازگاری Self-Consistency

Copyright © 2024