מהפכה במנועי החיפוש מתבררת כנושא מרכזי בעידן הבינה המלאכותית. צוות חדשני חשף שיטה כלכלית שעלולה להגדיר מחדש את התחום הזה שאינו ניתן להחמיץ. *להעריך בדיוק את הרלוונטיות של תוצאות החיפוש* הופך להיות חיוני לאור הדרישות הגוברות של משתמשי הבינה המלאכותית.
הגישה החדשה, שנקראת eRAG, מבטיחה *לשנות את אופן הפעולה של מנועי החיפוש* על ידי התאמתם לצרכים הספציפיים של מודלים של שפה. ההתקדמות הטכנית הזו עונה על חוסר ההתאמה הנוכחי בין החיפושים האנושיים לציפיות של הבינות המלאכותיות. *לנקוט צעדים קדימה לגבי מגמות חדשות* מציע הזדמנויות מרתקות עבור עסקים וצרכנים, הנדרשים להעריך מחדש את יחסיהם עם חיפוש מידע.
שיטה חדשנית: eRAG
צוות חוקרים מאוניברסיטת מסצ'וסטס המפך הציג לאחרונה שיטה מהפכנית בשם eRAG. מערכת זו מאפשרת להעריך את מהימנות המחקרים המיוצרים על ידי הבינה המלאכותית. פרסום השיטה התפרסם בProceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval.
צורך מובהק בהגדרה מחדש של מנועי החיפוש
במסורת, מנועי החיפוש פותחו כדי לענות על הצרכים האנושיים. עלירזה סאלמי, מחבר עיקרי של המחקר, מדגיש כי הכלים הללו עובדים בצורה מספקת כאשר המבקש הוא אדם. עם זאת, עלייתם של מודלים של שפה בגודל גדול (LLM), כגון ChatGPT, משנה את הדינמיקה הזו. שינוי זה דורש עיצוב מחדש של מנועי החיפוש כדי להתאים לדרישות הLLM.
האתגרים שה-LLM מתמודדים איתם
אנשים ו-LLM מציגים צרכי מידע שונים מהותית. לדוגמה, כאשר מחפשים ספר, אדם יכול לדייק את החיפוש שלו באמצעות מונחים רחבים, עד שיזהה את היצירה הרצויה. לעומת זאת, ה-LLM, שמותנים על ידי קבוצות נתונים ספציפיות, אינם יכולים לגשת למידע שאינו מופיע בבסיס הנתונים שלהם. מגבלה זו מקשה מאוד על ניהול בקשות מעורפלות.
הפתרון RAG
כדי להתמודד עם אתגרים אלה, החוקרים פיתחו מושג הידוע בשם retrieval-augmented generation (RAG). גישה זו מאפשרת ל-LLM להעשיר את התוצאות שסופקו על ידי מנועי החיפוש, ובכך להקל על רכישת מידע רלוונטי. השאלה המתעוררת היא: כיצד להעריך את התועלת של תוצאות אלו עבור ה-LLM?
שיטות הערכה קיימות
שלוש דרכי הערכה מרכזיות עומדות בפני החוקרים. הראשונה היא להתייעץ עם פאנל אנושי כדי לשפוט את הרלוונטיות. שיטה זו, אף שהיא קלאסית, מתבררת כמחמירה ובלתי יעילה להבנת הרגישות של ה-LLM למידע.
אלטרנטיבה היא להיעזר ב-LLM כדי ליצור שיפוטי רלוונטיות. טכניקה זו מתבררת כיותר חסכונית, אך כאשר לא משתמשים במודלים החזקים ביותר, הדיוק שלה עלול להיפגע. לבסוף, השיטה הזהובה כוללת הערכת הביצועים הקצה-לקצה של ה-LLM המוגברים על ידי חיפוש. עם זאת, היא עדיין יקרה ואטומה.
היתרונות של eRAG
בהתבסס על ממצאים אלה, סאלמי ושני חברו המשותף המהנדס המנומד חמיד זאמני פיתחו את eRAG, תהליך דומה לשיטה הזהובה אך חסכוני בהרבה. eRAG פועל עד שלוש פעמים יותר מהר ודורש חמישים פעמים פחות מעבד גרפי תוך שמירה על רמת מהימנות דומה.
הליך זה מתחיל באינטראקציה של משתמש אנושי עם סוכן AI מבוסס על LLM לצורך ביצוע משימה. הסוכן שולח בקשה למנוע חיפוש שמחזיר רשימה של כארבעים תוצאות. לאחר מכן, eRAG מעריכה כל אחת מהכניסות כדי לזהות את אלה שמועילות ליצירת תשובה מתאימה.
השלכות על עתיד מנועי החיפוש
אף מנוע חיפוש לא השיג עדיין תאימות גנרלית עם כלל ה-LLM שפותחו עד כה. למרות זאת, הדיוק, הכלכליות והקלות בהטמעת eRAG מהווים צעד מהותי לקראת אינטגרציה מלאה של הבינה המלאכותית במנועי החיפוש.
מחקר זה זכה בפרס Best Short Paper Award בכנס SIGIR 2024. חבילת Python ציבורית הכוללת את הקוד של eRAG זמינה בכתובת: GitHub.
שאלות ותשובות נפוצות
מהי השיטה eRAG ואיך היא פועלת?
eRAG היא שיטה חדשנית שמאפשרת להעריך את מהימנות מנועי החיפוש עבור מודלים של שפה בבינה מלאכותית. היא מפעילה אינטראקציה בין הבינה המלאכותית לבין מנוע החיפוש, ובודקת את איכות תוצאות החיפוש המיוצרות לשימוש על ידי מודלים של בינה מלאכותית.
מדוע יש צורך לחזור ולחשוב במנועי החיפוש בעידן הבינה המלאכותית?
מנועי החיפוש המסורתיים מיועדים לאנשים, בעוד שמודלים של שפה בבינה מלאכותית, כמו ה-LLMs, יש להם צרכי מידע שונים. חידוש הוא חיוני כדי לענות על צורכים חדשים אלו ולהשיג שיפור ביעילות החיפושים המבוצעים על ידי הבינה המלאכותית.
מה היתרונות של השיטה eRAG ביחס לשיטות הערכה המסורתיות?
השיטה eRAG היא מהירה עד שלוש פעמים יותר ומשתמשת ב-50 פעמים פחות מעבד גרפי תוך שהיא מציעה הערכה אמינה. היא עולה על שיטות אחרות שעשויות להיות יקרות ופחות מדויקות.
כיצד eRAG מסייע לשפר את הקשר בין מנועי החיפוש לבינה המלאכותית?
eRAG מקלה על דיאלוג בין הבינה המלאכותית לבין מנוע החיפוש, מה שמאפשר לכל ישות ללמוד זו על זו. זה מוביל לדייק את החיפושים המופקים על ידי הבינה המלאכותית, והרזולטטים הופכים להיות יותר רלוונטיים.
איזו הכרה ניתנה למחקר על eRAG?
המחקר המפתח את השיטה eRAG זכה בפרס של ה-Association for Computing Machinery במהלך הכנס SIGIR 2024, מה שמדגיש את ההשפעה המשמעותית שלו על תחום מחקר המידע בעידן הבינה המלאכותית.
כיצד eRAG תורם למעבר למנועי חיפוש מבוססים על בינה מלאכותית?
eRAG מהווה צעד משמעותי לעבר מנועי חיפוש מצוידים בבינה מלאכותית בכך שהיא מספקת מתודולוגיית הערכה מהימנה, מה שמקל על שילוב הבינה המלאכותית במערכות חיפוש כדי לשפר את חוויית המשתמש והרלוונטיות של התוצאות.
אילו אתגרים השיטה eRAG מספקת פתרון לגבי השיטות להערכה קודמות?
eRAG עוקף את האתגרים של יקרות וחוסר שקיפות של השיטות הקודמות, ומספקת פתרון שמעריך את ביצועי תוצאות החיפוש دون חסרונות השיטות המסורתיות.