מטא מוצאת את עצמה במרכז הזירה המשפטית, מואשמת בהכללת יצירות מוגנות בפיתוח של הבינה המלאכותית שלה. ההשלכות של המקרה הזה מעוררות שאלות לגבי החוקיות והאתיקה של הפרקטיקות המאומצות על ידי ענקי הטכנולוגיה. לאחר גילויים מזעזעים, מטא חשודה בניצול של בסיסי נתונים גנובים, המגיעים ממקורות שנויים במחלוקת, כדי לאמן את המודלים של הבינה המלאכותית שלה.
ההאשמות אינן מוגבלות לשימוש פשוט ביצירות שב DOMAIN ציבורי; הן גם מצביעות על מניפולציה מכוונת של הגנות זכויות יוצרים. המצב מדגיש את הצורך ברגולציות חזקות מול הפרקטיקות של חציית נתונים. מקרה זה עשוי להגדיר מחדש את גבולות זכויות היוצרים בסביבה הדיגיטלית.
מטא תחת אש על שימוש בנתונים גנובים
התובעים במקרה קדרי ואח' נגד מטא הגישו בקשה המאשימה את החברה בכך שהיא השתמשה בכוונה ביצירותprotected by copyright במהלך פיתוח מודלי הבינה המלאכותית שלה.
בין התובעים נמצא הסופר ריצ'רד קדרי, שהגיש "תגובה בתמיכה בבקשה של התובעים לקבל רשות להגיש תביעה מתוקנת שלישית מאוחדת" בבית המשפט של מחוז צפון קליפורניה.
גניבה מערכתית וניצול בלתי חוקי
מסמכים משפטיים טוענים כי מטא ביצעה שימוש מערכתית בטורנטים והסירה את המידע על ניהול זכויות היוצרים (CMI) מהמאגרי נתונים הגנובים, כולל אלה המגיעים מספריית רוחות רפאים ליבג'ן.
הוכחות מפלילות חושפות את מעורבות המנהיגים של מטא בשיטות אלה. התובעים טוענים כי המנכ"ל מארק צוקרברג נתן אישור מפורש לשימוש במאגר הנתונים ליבג'ן, למרות החששות שהעלו מנהלי הבינה המלאכותית של החברה.
מ memo פנימי מדצמבר 2024 הודה כי ליבג'ן היה "מאגר נתונים שאנו יודעים שהוא גנוב." דיונים החלו לגנוב לגבי ההשלכות האתיות והמשפטיות של השימוש בחומרים כאלה.
תקשורת פנימית והיסוסים
מסמכים פנימיים מרמזים כי לאחר רכישת מאגר הנתונים ליבג'ן, מטא הסירה את המידע על ניהול זכויות היוצרים מהיצירות המוגנות. פרקטיקה זו, שהועלתה על ידי התובעים, הופכת לאופן מרכזי בהאשמותיהם על עבירה על זכויות יוצרים.
מייקל קלارك, נציג מטא, הצהיר כי החברה יישמה סקריפטים כדי להסיר כל אינדיקציה על זכויות יוצרים, כולל מילות מפתח כמו "זכויות יוצרים" ו"תודות." מניפולציה זו נועדה להכין את מאגר הנתונים לאימון המודלים של IA Llama של מטא.
ההשלכות האתיות והמשפטיות
ההאשמות כבדות מאוד על תדמית מטא, מתארות את החברה כמולכדת בתוכנית גניבה רחבת היקף. הודעות דוא"ל בין מהנדסי מטא חושפות חששות בנוגע לאופטיקה של טורנינג ממחשבים ניידים של החברה.
מהנדס אחד הביע כי "שימוש במחשב נייד [של מטא] לטורנט לא נראה נכון," למרות זאת, ההורדות המהירות וההפצה של נתונים גנובים התרחשו.
היועץ המשפטי של התובעים טען כי בינואר 2024, מטא "כבר טורנתה (הורידה והפיצה) נתונים מהליבג'ן." בנוסף, מספר מסמכים רלוונטיים כבר הושגו על ידי מטא, אך נלמדו בשלב הראשון של גילוי.
הצהרות של צוקרברג והרחבת התביעה
במהלך עדות ב-17 בדצמבר 2024, צוקרברג הכיר כי פעולות כאלה יגביהו "הרבה דגלים אדומים" והודה כי זה "נראה בעייתי," הוסיף כי הוא סיפק מעט מאוד תשובות ישירות לגבי פרקטיקות האימון של IA של מטא.
בהתחלה, המקרה התמקד בהפרת הקניין הרוחני בשל השימוש של הבינה המלאכותית בחומרים מוגנים. התובעים מחפשים עכשיו להוסיף שתי האשמות משמעותיות: הפרת חוק ההגנה על זכויות יוצרים הדיגיטלי (DMCA) והפרת החוק הקליפורני גישה ותרמית נתונים (CDAFA).
ההשפעות הפוטנציאליות על החקיקה בנוגע לבינה מלאכותית
התובעים טוענים כי מטא הסירה במכוון את ההגנות על זכויות יוצרים כדי להסתיר שימושים לא מורשים של טקסטים מוגנים במודלים Llama שלה.
ההאשמות כלפי ה-CDAFA נוגעות לשיטות הרכישה בהן השתמשו כדי להשיג את מאגר הנתונים ליבג'ן, כולל פעולות טורנינג במטרה להשיג תוכן מוגן.
בתקשורת הפנימית שלהם, מהנדסים הביעו בגלוי את חששותיהם בנוגע לחוקיות של seeding והטורנטינג, וציינו שזה עשוי להוות בעיות משפטיות.
השפעה על זכויות יוצרים ויוצרים
הסכסוך הזה מדגיש את הצורך הגובר בהבהרות לגבי הישיבה בין החוק על זכויות יוצרים ופיתוח של IA. התובעים טוענים כי הסרה של הגנות זכויות יוצרים שוללת מהיוצרים את הפיצוי ההוגן שלהם.
מטא ממשיכה להכחיש את כל ההאשמות במקרה הזה ועד כה לא השיבה פומבית להצהרות שנעשו במהלך העדות של צוקרברג.
המקרה הזה מגיע בזמן שהתנגדות הגלובלית סביב טכנולוגיות בינה מלאכותית גנרטיבית הולכת ומתרקמת. חברות אחרות, כמו OpenAI וגוגל, גם נתקלות בביקורות לגבי השימוש בנתונים מוגנים כדי לאמן את המודלים שלהן.
מטא צריכה להתמודד עם ההאשמות הללו כשברקע נתוני הבינה המלאכותית בתור ציר מרכזי של אסטרטגיה עתידית שלה, כאשר ההאשמות בהסתמכות על ספריות גנובות עשויות לפגוע בשאיפות שלה להנהיג בתחום.
המקרה קדרי ואח' נגד מטא עשוי להשפיע באופן ניכר על פיתוח המודלים של IA בעתיד, ופותח פתח להקניית תקדימים משפטיים משמעותיים.
סופרים טוענים כי צוקרברג אישר את השימוש בספרים גנובים.
עסקאות מסוכנות באינטרנט: תופעה של חטיפת גופות.
שאלות נפוצות לגבי מטא ושימוש בנתונים גנובים
מהן ההאשמות המוטלות על מטא בנוגע לשימוש בנתונים גנובים?
מטא מואשמת בניצול יצירות מוגנות בזכויות יוצרים, כולל ספרים, לאימון המודלים של הבינה המלאכותית שלה כמו Llama, ללא אישור מבעלי הזכויות.
איך מטא מצדיקה את השימוש בנתונים הגנובים הללו?
מטא עדיין לא סיפקה הסבר מספק. ההאשמות מזווגות כי מנהיגים בתוך החברה, כולל מארק צוקרברג, אישרו את השימוש בנתונים הללו למרות החששות האתיות והמשפטיות.
מהן ההשפעות הפוטנציאליות של במקרה הזה על פיתוח הבינה המלאכותית?
המקרה עשוי ליצור תקדימים משפטיים בנוגע לזכויות יוצרים ולפרקטיקות האימון של מודלי IA, דבר שעשוי להשפיע על האופן שבו חברות טכנולוגיות רוכשות ומשתמשות בנתונים בעתיד.
איזה חוקים מעורבים במקרה הזה?
ההאשמות כוללות הפרות של חוק זכויות יוצרים הדיגיטלי (DMCA) וחוק ההגנה על זכויות הנתונים של קולורדו (CDAFA), המגנים על זכויות יוצרים ומסדירים את הגישה לנתונים.
האם יוצרים יכולים לתבוע פיצויים ממטא?
כן, סופרים ובעלי זכויות יכולים להגיש תביעה על הפרת זכויות יוצרים ולבקש פיצויים אם ההאשמות נגד מטא יתקבלו.
איך המקרה עשוי להשפיע על התדמית של מטא?
המורגנות הנתונה של מטא על נתונים גנובים עשויה לפגוע בתדמיתה, במיוחד בהקשר שבו היא מנסה לשמור על מעמדה כפורצת דרך בתחום החדשנות הטכנולוגית.
מהן הנושאים האתיים המרכזיים המודגשים במקרה הזה?
הנושאים האתיים נוגעים ללגיטימיות של השימוש ביצירות מוגנות לאימון מודלי IA, כמו גם לכיבוד זכויות היוצרים בסביבה דיגיטלית המשתנה כל הזמן.
מהי התגובה של הציבור והרשויות כלפי פעולות מטא?
התגובה בעיקר שלילית, עם ביקורת גוברת על השפעתנה של פרקטיקה כזו על היוצרים ועל ההגינות של מערכות הבינה המלאכותית שהתפתחו עם נתונים לא מורשים.
באיזה הקשר חוקי מתבצע המקרה הזה כיום?
המקרה הזה מתנהל כיום בבית המשפט המחוזי בארצות הברית במחוז הצפון של קליפורניה, שם התובעים מנסים לאכוף את זכויותיהם ולהרחיב את ההאשמות נגד מטא.
מהן ההשלכות עבור חברות טכנולוגיה אחרות?
תוצאות המקרה עשויות להמריץ חברות נוספות לבחון מחדש את פרקטיקות רכישת הנתונים שלהן ולכבד את זכויות היוצרים כדי להימנע מבעיות משפטיות דומות.