עידן הבינה המלאכותית מציב אתגרים עצומים בהכשרה של רובוטים רב-תכליתיים. התגברות על חוסר היעילות של שיטות מסורתיות דורשת גישה מהפכנית. טכניקה חדשנית צצה, המבטיחה *אופטימיזציה משמעותית* של תהליך הלמידה.
הכשרת רובוטים גמישים היא עניין קרדינלי. באמצעות שימוש במגוון רחב של נתונים לא הומוגניים, שיטה זו מקדמת *למידה מהירה יותר* ויעילה יותר.
השילוב בין תפיסה לפעולה מחדש את יכולות הרובוטיקה, פותח את הדרך ל *יישומים מגוונים ומורכבים*.
שיטה חדשנית להכשרת רובוטים רב-תכליתיים
אתגר ההכשרה של רובוטים רב-תכליתיים היה נושא מכשול במשך זמן רב בתחום הרובוטיקה. התהליך המסורתי מתבסס על אוסף נתונים ספציפיים לכל רובוט ולכל משימה בסביבה מבוקרת. שיטה זו נשארת יקרה ומייגעת, מה שמקשה על הכללת המיומנויות. הרובוטים מתקשים להסתגל לסביבות בלתי מוכרות או למשימות שלא נתקלנו בהן בעבר.
גישה חדשנית של חוקרי ה-MIT
חוקרים מMIT פיתחו טכניקה יעילה המשלבת כמויות עצומות של נתונים לא הומוגניים למערכת אחת. שיטה זו מאפשרת ללמד מגוון של משימות לרובוטים שונים. הגישה מתבססת על יישור נתונים המגיעים מסימולציות, רובוטים אמיתיים ורב מודליות, כגון חיישנים חזותיים ומקודדי מיקום של זרועות רובוטיות. כל הנתונים הללו מומרת לשפה משותפת, המובנת על ידי מודל של בינה מלאכותית גנרטיבית.
יעילות ורווחיות
באמצעות שילוב של קבוצות נתונים שונות, טכניקה זו מתגלית כמהירה וזולה יותר לעומת השיטות המסורתיות. הצורך בנתונים ספציפיים פחות למשימות מאפשר נוחות חסרת תקדים. התוצאות מראות שיפור של יותר מ-20% בביצועים במהלך ניסויים בסימולציה ובתנאים אמיתיים, על ידי התעלות על ההכשרה המסורתית.
מודל בהשראת LLMs
הגישה החדשנית מתבססת על השראה מהמודלים לשוניים גדולים. המושג של "מדיניות" רובוטית מעריכה תצפיות באמצעות חיישנים לפני שהיא מציינת פעולות ספציפיות לרובוט. באופן מסורתי, המדיניות הללו מעוצבות דרך למידה חיקויית, בה אדם מדריך רובוט כדי לייצר נתונים.
תהליך זה מלווה לעיתים קרובות במגבלות מול שינויים בסביבה או במשימות. על ידי שילוב מושגים מה-LLMs, החוקרים מציעים הכשרה מוקדמת עם מאגר נתונים רחב, המאפשר הסתגלות חלקה למגוון משימות, תוך כך שדורש מעט מאוד נתונים ספציפיים.
הרכבה ועיבוד מידע
נתוני הרובוטיקה מופיעים בצורות שונות, כולל תמונות ממצלמות והנחיות בשפה טבעית. ה-MIT יצר אדריכלות בשם Transformeurs Préentraînés Hétérogènes (HPT), הממוקדת באחדות של נתונים ממודאליות שונות. אדריכלות זו מרכזת מודל של למידת מכונה המפרש את הקלטים החזותיים והפריוספטיביים, בדומה למבנים של LLMs.
ה-transformeur ממיר את הקלטים השונים למרחב משותף, דבר שמגביר את היעילות של המודל ככל שהוא לומד מכמות נתונים רבה יותר. המשתמש צריך לספק רק נתונים הקשורים לעיצוב ולמשימות של הרובוט. לאחר מכן, HPT מעביר את הידע שצבר על מנת ללמוד במהירות משימה חדשה.
לקראת תנועות יותר גמישות
אתגר מרכזי בפיתוח HPT היה הקמת מאגר נתונים עצום להכשרה המוקדמת, הכולל יותר מ-200,000 מסלולי רובוטיקה מ-52 קבוצות שונות. תהליך זה דורש גם המרה יעילה של אותות פריוספטיביים גולמיים, המבטיחה התייחסות שווה לאותות ביחס לנתונים החזותיים.
הבדיקות שנעשו מראות ש-HPT משפר את ביצועי הרובוטים ביותר מ-20%. תוצאות אלו נשארות חיוביות גם כאשר המשימות שונות במידה רבה מהנתונים שבהם השתמשנו להכשיר את הרובוט.
חזון לעתיד
החוקרים שואפים לחקור כיצד מגוון הנתונים עשוי להגדיל את היעילות של HPT. השאיפה האולטימטיבית היא לפתח את HPT על מנת לעבד נתונים לא מסומנים, בדומה ל-LLMs המודרניים. החלום הוא ליצור מוח רובוטי אוניברסלי שכל משתמש יכול להפעיל ללא הכשרה מקדימה.
מימון עבור מחקר זה מגיע, חלקית, מהיוזמה של Amazon Greater Boston Tech ומהמכון לחקר טויוטה. צעדים אלו מעידים על רצון קולקטיבי לקדם את הרובוטיקה לרמות של גמישות ורב-תכליתיות שהן עדיין לא היו קיימות.
שאלות נפוצות על שיטה מהירה ויעילה יותר להכשרת רובוטים רב-תכליתיים
מהי שיטה מהירה ויעילה יותר להכשרת רובוטים רב-תכליתיים?
זוהי טכניקה שמשלבת מגוון רחב של נתונים מקורות שונים ומודאליות שונות כדי לאמן רובוט לבצע מגוון משימות מבלי להידרש להתחיל את הלמידה מחדש בכל פעם.
כיצד שיטה זו משפרת את ההסתגלות של הרובוטים?
גישת זו מאפשרת לרובוטים לרכוש מיומנויות שונות בזמן קצר, על ידי הכשרתם על בסיס נתונים קיימים, מה שמאפשר להם להסתגל טוב יותר לסביבות ולמשימות בלתי מוכרות.
אילו סוגי נתונים משמשים בשיטה זו?
טכניקה זו מתבססת על מגוון רחב של נתונים, כולל סרטוני הדגמה אנושיים, סימולציות, חיישני ראיה ומידע על מיקום, המיושרים לשפה משותפת לצורכי למידה.
מהו תפקיד ה-Heterogeneous Pretrained Transformers (HPT) בטכניקה זו?
ה-HPT מאחדים ועיבדים את הנתונים הלא הומוגניים למודל למידה יחיד, מה שמאפשר לרובוט להעביר את הידע שרכש במהלך ההכשרה המוקדמת למשימות חדשות.
מהם היתרונות הכלכליים של שיטה זו עבור החברות?
היא מפחיתה את העלות ואת הזמן הנדרשים לאיסוף נתונים ספציפיים לכל משימה, ובכך מאפשרת לחברות להכשיר רובוטים יעילים מבלי שהן ידרשו להשקיע סכומים גבוהים בנתונים.
כיצד שיטה זו משווה לשיטות למידה מסורתיות?
השיטה בדרך כלל מהירה ויעילה יותר, על ידי כך שהיא מתעלה על השיטות המסורתיות ביותר מ-20% במחקרי סימולציה ועולם אמיתי, מכיוון שהיא מנצלת נתונים קיימים.
האם שיטה זו יכולה להיות מיועדת לסוגים שונים של רובוטים?
כן, שיטה זו נועדה להיות רב-תכליתית ויכולה לשמש עבור סוגים שונים של רובוטים, להקל על הלמידה בקרב עיצובים שונים ובתצורות מכניות שונות.
אילו אתגרים נתקלנו במהלך פיתוח טכניקה זו?
אחד האתגרים המרכזיים היה יצירת מאגר נתונים עצום הכולל אלפי מסלולי רובוטים ועיבוד יעיל של אותות מכמה חיישנים.
האם שיטה זו פועלת עבור משימות שונות מאוד מהמשימות שעליהן הרובוט הוכשר מראש?
כן, השיטה הוכיחה שיפורים בביצועים גם כאשר המשימות היו שונות באופן משמעותי מהנתונים שנעשו בהם שימוש במהלך הלמידה.
מה הראיה העתידית לשימוש בטכניקה זו ברובוטיקה?
החוקרים שואפים להמשיך לחקור כיצד מגוון הנתונים יכול לשפר עוד יותר את הביצועים וחולמים על "מוח רובוטי אוניברסלי" שניתן להוריד מבלי שידרש ללמוד נוסף.