ההפליה הקיימת במודלים של בינה מלאכותית נותרה שאלה דחופה בפיתוח הטכנולוגי המודרני. כלי חדש, *LangBiTe*, צומח כדי להביא תשובה מערכתית לאתגר הזה. לנתח הטיות לעומק הוא צו אתי, במיוחד לאור ההשפעה של בינה מלאכותית על חיינו היומיומיים. מסגרת חופשית וגמישה פותחת את הדרך לשימוש יותר אחראי בבינה מלאכותית. החוקרים מתמודדים לא רק עם דעות קדומות הקשורות למגדר, אלא גם עם אפליות גזעיות, פוליטיות ודתיות. כלי זה מגלם התקדמות משמעותית לבינה מלאכותית אופטימלית והוגנת.
פיתוח LangBiTe
חוקרים מהUniversitat Oberta de Catalunya ומהUniversité de Luxembourg פיתחו את LangBiTe, תוכנית קוד פתוח. כלי זה מעריך את נוכחות ההטיות במודלים של בינה מלאכותית (בינה מלאכותית), ומבטיח את התאמתם לחוקי האי-אתריות.
Sergio Morales, חוקר המעורב בפרויקט, ציין כי LangBiTe מיועד להיות משאב שימושי הן עבור מעצבי כלים לבינה מלאכותית גנרטיבית וגם למשתמשים שאינם טכנולוגיים. המטרה היא לזהות ולהקל על ההטיות במודלים, ובכך לתרום לשיפור מערכות הבינה המלאכותית בעתיד.
הדוקטורט של מוראלס קיבל תמיכה מ-Robert Clarisó ו-Jordi Cabot, שכל אחד מהם הביא את המומחיות שלו לפרויקט. המחקר פורסם בפרוטוקולי Proceedings of the ACM/IEEE 27th International Conference on Model Driven Engineering Languages and Systems.
אנליזה מעבר למאפייני מגדר
LangBiTe מתבלט מכלים אחרים על ידי אזור הפעולה שלו. החוקרים טוענים שהוא התוכנית ההכי מלאה והמפורטת הזמינה כיום. באופן ראשוני, הרבה מחקרים התמקדו בהפליה הקשורה למגדר, לעיתים קרובות מזניחים פרספקטיבות אחרות אתיות ומיעוטים פגיעים.
פרויקט LangBiTe אפשר להעריך איך חלק מהמודלים של בינה מלאכותית יכולים לייצר תגובות בצורה גזענית, עם זווית פוליטית מוטה, או בשידור עיוותים הומופוביים. החוקרים גם ציינו כי לפרויקטים אחרים היה מסגרת אתית שטחית, ללא הערכה מדוקדקת של ההיבטים הספציפיים.
גמישות והתאמה של הכלי
התוכנית LangBiTe מציעה אנליזה על הרלוונטיות של יישומים הכוללים פונקציות בינה מלאכותית עבור כל מוסד או קהילת משתמשים. הכלי אינו מציע מסגרת מוסרית מדויקת, ומשאיר לכל ארגון חופש להגדיר את דאגותיו האתיות. מוראלס מדגיש כי הערכת ההטיות חייבת להיות מותאמת להקשר התרבותי ולחקיקה של המשתמשים.
לכך, LangBiTe כולל יותר מ-300 פרומפטים המקלות על זיהוי נטיות במודלים של בינה מלאכותית. הפרומפטים עוסקים בדאגות אתיות שונות, כמו גיל, העדפות פוליטיות, דעות קדומות דתיות, והפליות מגדריות.
כל פרומפט מקושר לתגובות המאפשרות להעריך את ההטיות. כמו כן, כלולים דגמים של פרומפטים שניתן לשנות, המאפשרים למשתמשים לעשיר את הכלי עם שאלות חדשות.
גישה למודלים רבים של בינה מלאכותית
LangBiTe מאפשר גישה למודלים בלעדיים של OpenAI, כמו GPT-3.5 ו-GPT-4, כמו גם למודלים רבים נוספים זמינים ב-HuggingFace ו-Replicate. הפלטפורמות הללו מקלות על האינטראקציה עם מודלים שונים, כולל אלה של Google ו-Meta. מוראלס מוסיף שכל מפתח יכול להרחיב את LangBiTe כדי להעריך מודלים אחרים.
המשתמשים יכולים גם להשוות את ההבדלים בין התגובות המוצעות על ידי גרסאות שונות של אותו מודל או על ידי מודלים מספקים שונים. לדוגמה, הערכה גילתה כי המודל ChatGPT 4 השיג שיעור הצלחה של 97% במהלך הבדיקות נגד הטיית מגדר, בעוד שקודמו, ChatGPT 3.5, הציג שיעור של 42%.
לגבי מודל Flan-T5 של Google, נצפה כי גודל מוגדל היה קשור להפחתת ההטיות בנושא מגדר, דת ו nationalità.
אנליזה רב-לשונית ומולטימדיה
הרוב המוחלט של מודלי הבינה המלאכותית הפופולריים נבנו מתוך תוכן בשפה האנגלית. עם זאת, יוזמות אזוריות מתרחשות כדי להכין מודלים בשפות נוספות, כמו קטלנית ואיטלקית. החוקרים של UOC כללו אפשרות להעריך את האתיקה של הכלים בהתאם לשפה שבה נעשה שימוש בשאלות.
המחקר גם כולל אנליזה של מודלים המייצרים תמונות, כמו Stable Diffusion ודל.איי. היישומים של כלים אלה נעים מהפקת ספרי ילדים ליצירת תוכן גרפי, תחומים שבהם לעיתים קרובות מוקרנים סטריאוטיפים שליליים.
החוקרים מקווים כי LangBiTe יהיה חיוני כדי לזהות ולתקן כל סוג של הטיות בתמונות שנוצרות על ידי מודלים אלה.
עמידה בדרישות החקיקה האירופית
המאפיינים של LangBiTe יכולים לסייע למשתמשים לעמוד בדרישות EU AI Act האחרון. תקנה זו נועדה להבטיח כי המערכות החדשות של בינה מלאכותית מקדמות שוויון גישה, שוויון מגדרי ומגוון תרבותי, כדי להגן על זכויות האי אפליה שהוקמו על ידי האיחוד האירופי וחוקי המדינות החברות.
מוסדות, כמו Luxembourg Institute of Science and Technology (LIST), החלו לשלב את LangBiTe על מנת להעריך מספר מודלים פופולריים של בינה מלאכותית גנרטיבית.
מידע נוסף :
Sergio Morales ואח', DSL כדי לבדוק את ה-LLMs עבור שוויון והטיה, Proceedings of the ACM/IEEE 27th International Conference on Model Driven Engineering Languages and Systems (2024). DOI: 10.1145/3640310.3674093
שאלות נפוצות
מהו LangBiTe וכיצד הוא פועל?
LangBiTe הוא כלי קוד פתוח שנועד לזהות הטיות במודלים של למידת מכונה. הוא משתמש בסדרת יותר מ-300 פרומפטים כדי להעריך כיצד המודלים הללו מגיבים לשאלות רגישות, תוך ניתוח היבטים כמו גזענות, סקסיזם ועוד צורות של אפליה.
מדוע חשוב לזהות הטיות בבינה מלאכותית?
זיהוי ההטיות הוא חיוני מכיוון שמודלים של בינה מלאכותית יכולים לשכפל ולהגביר סטריאוטיפים ואפליות קיימות, מה שעלול להוביל להחלטות מוטות בתחומים רגישים כמו גיוס, אשראי ופליליה. זיהוי ההטיות הללו מסייע להבטיח שוויון ואתיקה בשימוש בבינה מלאכותית.
מהן המאפיינים המרכזיים של LangBiTe ביחס לכלים אחרים לזיהוי הטיות?
LangBiTe מתבלט על ידי היקפו ועומק הניתוח שלו. בניגוד לכלים אחרים שמתמקדים בעיקר בהפליה של מגדר, LangBiTe מעריך גם ההטיות הגזעיות, פוליטיות ותרבותיות, ובכך מציע תמונה רחבה יותר של בעיות האפליה במודלים של בינה מלאכותית.
האם LangBiTe יכול להיבחר על ידי אנשים ללא כישורים טכניים בבינה מלאכותית?
כן, LangBiTe תוכנן להיות נגיש גם למפתחים של כלים בבינה מלאכותית וגם למשתמשים שאינם טכנולוגיים. הממשק האינטואיטיבי שלו מאפשר למשתמשים להגדיר את הדאגות האתיות שלהם וליישם קריטריוני הערכה המותאמים להקשר שלהם.
אילו סוגים של העדפות יכולות להיבחן בעזרת LangBiTe?
LangBiTe יכול לזהות מגוון של הטיות, כולל גזענות, סקסיזם, הומופוביה, טראנספוביה, גילנות ודעות קדומות דתיות או פוליטיות. כל פרומפט נועד לבחון היבט ספציפי של ההטיות הקיימות במודלים של בינה מלאכותית.
כיצד LangBiTe מבטיח עמידה בדרישות החוקיות לגבי אי-אפליה?
LangBiTe מסייע למשתמשים להעריך את יישום הבינה המלאכותית שלהם מול הדרישות האתיות והרגולטוריות של התרבות והמשטר שלהם. זה מאפשר לארגונים להקפיד על הסטנדרטים של החקיקה בעניין אי-אפליה, כולל אלה שהוקמו על ידי האיחוד האירופי.
האם LangBiTe יכול להעריך מודלים בשפות רבות?
כן, LangBiTe כולל יכולות הערכה עבור מודלים בשפות שונות, מה שמאפשר למשתמשים לזהות הטיות בשפה בתגובות של מודלים של בינה מלאכותית בהתאם לשפות שבהן הושאלו השאלות.
אילו סוגים של מודלים של בינה מלאכותית ניתן לנתח עם LangBiTe?
LangBiTe יכול לנתח מגוון מודלים, כולל מודלים של OpenAI, כמו גם מודלים אחרים זמינים בפלטפורמות כמו HuggingFace ו-Replicate, מה שמאפשר השוואה בין ספקים שונים.
האם אפשר להוסיף דאגות חדשות אתיות ל-LangBiTe?
כן, LangBiTe כולל מודלים של פרומפטים שניתן לשנות, מה שמאפשר למשתמשים להוסיף שאלות או דאגות אתיות חדשות בהתאם לצרכים הספציפיים שלהם.
איפה המוסדות משתמשים כיום ב-LangBiTe?
LangBiTe כבר אומץ על ידי מוסדות כמו Luxembourg Institute of Science and Technology (LIST), אשר משתמשים בו להעריך מספר מודלים פופולריים של בינה מלאכותית גנרטיבית במסגרת פרויקטי מחקר ועמידה בדרישות.





