אתגרים את יכולות הבינה מלאכותית הכרחי, במיוחד כשמדובר בשחזור יצירת מופת. הניסיונות להעתיק את "המפנק המפונק", הסרט הראשון בהיסטוריה, מעלה שאלות יסודיות. האתגר חורג מהשחזור הטכני הפשוט; הוא כולל רהור על מהות הקולנוע ועל יצירה אמנותית. הישגי הטכנולוגיה, אם כי מרשימים, נכשלו בלכוד את מהות יצירה האיקונית. תוצאות ניסיונות אלו מחזירות תמונה של חוסר עקביות ואכזבה, ובכך מדגימות את הגבולות הנוכחיים של ה-AI בתחום הקולנוע.
ניסיון שאפתני בהפקת וידאו באמצעות בינה מלאכותית
האתגר האחרון הושק: לשחזר את "המפנק המפונק", הסרט הראשון בדיוני. יצירת מופת זו, שביים לואי לומייר בשנת 1895, הייתה מטרה לסדרה של ניסויים על ידי מודלים של בינה מלאכותית, כמו סורה של OpenAI, Gen-4 של Runway, ויאו-2 של גוגל קלינג של קואישואו. המטרה הייתה לקבוע אם ה-AI יכול ליצור סצנות כה חלקות וקורעות מצחוק כמו היצירה המקורית.
פירוק הסצנות המקוריות
כדי להשיג את המטרה, הסרט חולק לארבע סצנות עיקריות. כל סצנה הייתה צריכה ללכוד רגעים מרכזיים: הגנן שמשקה את גנו, הילד שמונע מהמים לזרום, החזרה הפתאומית של המים על הגנן, ולבסוף, הניסיון של הגנן לתפוס את הילד. כל מקטע נושא פוטנציאל קומדי, שהוא האלמנט המרכזי של הסרט הראשון המוקלט.
ניסיונות ראשונים עם סורה של OpenAI
הגישה הראשונה נשענה על המודל הקלאסי טקסט-לווידאו של סורה. התוצאות, עם זאת, היו מבלבלות. הסצנות הופיעו לגמרי מחוץ להקשר, מאכזבות את הציפיות הראשוניות. בניסיון למצוא פתרון, החוקרים פנו למודל תמונה-לוידאו עם סורה, שסיפקה למודלים תמונות קפואות לפוטנציאל עקביות טוב יותר. לצערנו, שיטה זו גם לא הובילה לתוצאות משביעות רצון.
צביעה בעזרת AI
מותקפים בתוצאות שאינן משביעות רצון, הנסיינים פנו לתמונות מהסרט המקורי. דימויים אלו צויגו לאחר מכן בעזרת ג'מיני פלאש 2.0 Exp של גוגל, מה שמבטיח נאמנות אסתטית גבוהה יותר. הצבעוניות יצאה עם סצנות חיוניות, המזכירות את אלו שצילומים אמיתיים היו יכולים להציע.
חקירה עם Gen-4 של Runway
בחדש את מאמציהם, החוקרים שינו מודל, פנו ל-Gen-4 של Runway. תוך שימוש בדימויים המצויירים כבסיס, ניסו להניע סצנות. למרות תוצאה מעט יותר רלוונטית, הניסיונות נחשבו באופן נרחב מתחת לציפיות. סצנה שנייה, לדוגמה, הייתה רחוקה כל כך מהחזון המיוחל שהיא עוררה אכזבה.
שימוש ב-Veo-2 של Google DeepMind
Veo-2, התוצר האחרון של Google DeepMind, הוצג כדי לנסות לשפר את המצב. המודל הזה אפשר הכללות נאמנות יותר, וכשחושבת בהקשר של זמן ומקום הייתה מסודרת יותר. הסצנות הותירו רושם של חיים אמיתיים, אף על פי שהיו בעיות עקביות שצריך היה להתלונן עליהן, במיוחד באשר לפנים ולתחפושות של הדמויות.
תוצאה והערכה סופית
השלב האחרון כלל את סקירת הדימויים שהופקו על ידי ג'מיני, במטרה לדייק אותם. כל סצנה הוגשה למודל Kling 2.6 של קואישואו, מתוך תקווה להשיג חיבור בין אסתטיקה וכבוד ליצירה המקורית. התוצאות התבררו כיותר פוטוריאליסטיות, אך לא משכנעות באשר לעלילה. השינויים בין הסצנות נותרו בולטים מדי, מטילים ספק בזמינות ההיסטוריה.
למרות שעות רבות של עבודה קשה, ההכרעה הוטלה: לשחזר סרטים, אפילו את הראשון, היא משימה מורכבת עבור הבינות המלאכותיות המודרניות. ניסיונות אלה מבהירים את המגבלות הנוכחיות של ה-AI בווידאו, כאשר הפוטנציאל שלה נראה רחב אך עדיין בחיתוליו. החוקרים, מצוידים בעמידות, ממשיכים בחקירותיהם, מתוך תקווה לראות את ה-AI מגיעה לגבהים חדשים.
שאלות נפוצות על השימוש בבינה מלאכותית בשחזור הסרט הראשון ההיסטורי
מדוע הבינה המלאכותית לא הצליחה לשחזר את "המפנק המפונק" בצורה משביעת רצון?
ההתקדמות של הבינה המלאכותית בתחום ההפקת וידאו עדיין בשלב הניסי. המודלים שנבדקו חוו קשיים בלכידת עקביות נרטיבית ווויזואלית של הסצנות, מה שגרם לתוצאה הסופית להיות רחוקה מהציפיות.
אילו מודלים של בינה מלאכותית שימשו בניסיון זה?
מודלים כמו סורה של OpenAI, Gen-4 של Runway, ויאו-2 של גוגל, וכמה מקוישואו נבדקו בניסיון לייצר את הוידאו.
מה היו המגבלות העיקריות של המודלים AI שהיו בשימוש?
הבעיות העיקריות כללו חוסר עקביות בפרטים אוטומטיים, כמו שינוי במראה הדמויות ופעולות שהוטעו באופן לא נכון, מה שהקשה על הבנת רצף הסצנות.
כיצד הכנתם את הסצנות לניסיון ההפקה של הוידאו?
הסצנות מהסרט המקורי חולקו לארבע דקות עיקריות, כאשר תשומת לב מיוחדת ניתנה לתיאור כל פעולה, כדי לספק למודלים AI נקודות התייחסות ברורות.
איזה סוג של תמונות שימש כדי להזין את מודלי ה-AI?
תמונות שהופקו ממודלים אחרים של AI וכמה תצלומים מהסרט המקורי שצויירו שימשו כבסיס הוויזואלי לכל סצנה כדי לשפר את עקביות התוצאות.
מה הייתה הגישה המבטיחה ביותר במהלך הניסויים?
השיטה עם ויאו-2 הוכיחה את עצמה כמבטיחה ביותר, מצליחה להפיק סצנות יחסית עקביות, אף על פי שהתוצאות נותרו רחוקות מהציפיות.
מדוע השימוש ב-AI כדי לשחזר סרט זה נחשב "רמאות"?
היו אזכורים לשימוש בתמונות שהוקלטו מהסרט המקורי ובצביעה שלהן, מה שיכול להתפרש כרמאות שכן זה לא מדובר ביצירה מקורית לחלוטין שמבוססת על בינה מלאכותית.
אילו לקחים התקבלו מהניסיון של הבינה המלאכותית?
התקבלו מסקנות, שאף על פי ההתקדמות שהושגה, הבינה המלאכותית ההולמת בתקשורת האודיו-ויזואלית אינה מוכנה עדיין לשחזר סרטים היסטוריים עם הדיוק הנדרש, מה שמצביע על הצורך בפיתוח נוסף בתחום.
האם אפשר לצפות לתוצאות טובות יותר עם התקדמות ה-AI בווידאו?
כן, יש סבירות גבוהה שהמודלים של הבינה המלאכותית ימשיכו להשתפר, מה שעשוי להעניק יכולות טובות יותר בהפקת וידאו בעתיד.