ಕೋಶಗಳನ್ನು ಬದಲಾಯಿಸುವುದು ಕೃತಕ ಬುದ್ಧಿಮತ್ತು ಯ ಸಾಮರ್ಥ್ಯವನ್ನು ಪ್ರಶ್ನಿಸುವುದು ಅಗತ್ಯವಾಗುತ್ತದೆ, ವಿಶೇಷವಾಗಿ ಒಂದು ಶ್ರೇಷ್ಠ ಕರ್ಮವನ್ನು ಪುನರ್ರಚಿಸಲು. “L’Arroseur arrosé” ನ ಪುನರುತ್ಪಾದನೆಯ ಪ್ರಯತ್ನಗಳು, ಇತಿಹಾಸದಲ್ಲಿ ಮೊದಲ ಚಿತ್ರ, ಮೂಲಭೂತ ಪ್ರಶ್ನೆಗಳನ್ನು ಉಂಟುಮಾಡುತ್ತವೆ. ಸಮಸ್ಯೆ ಕೇವಲ ತಾಂತ್ರಿಕ ಪುನರುತ್ಪಾದನೆಯನ್ನು ಮೀರಿಸುತ್ತದೆ; ಇದು ಚಿತ್ರಕಲೆಯ ಮತ್ತು ಕಲೆ ನಿರ್ಮಾಣದ ಸ್ವಭಾವವನ್ನು ಕುರಿತಾದ ಚಿಂತನವನ್ನು ಒಳಗೊಂಡಿದೆ. ತಂತ್ರಜ್ಞಾನದಲ್ಲಿ ನಡೆದ پيشرفتಗಳು, ಅತೀ ಅದ್ಭುತವಾಗಿದ್ದರೂ, ಸಂಕಲ್ಪಶೀಲವಾದ ರಚನೆಯರೀತಿ ದ್ರವ್ಯವನ್ನು ಹಿಡಿಯಲು ವಿಫಲವಾಗುತ್ತವೆ. ಈ ಪ್ರಯತ್ನಗಳ ಫಲಿತಾಂಶವು ಅಸಂಗತಿ ಮತ್ತು ನಿರಾಸೆಗಾಗಿ ಚಿತ್ರವನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ, ಈ ರೀತಿಯಲ್ಲಿ ಚಿತ್ರ ಕ್ಷೇತ್ರದಲ್ಲಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ನಾಟಕರಂತೆಯಾದ ವಿವರಣವನ್ನು ತೋರಿಸುತ್ತದೆ.
ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಬಳಸಿ ವಿಡಿಯೋ ಉತ್ಪಾದನೆಗೆಾಗಿದೆ ಪ್ರಯತ್ನ
ಅಂತಿಮ ಪ್ರಶ್ನೆಯಾದದ್ದು: “L’Arroseur arrosé” ಅನ್ನು ಪುನರುಚಿಸಲು ಕನಿಷ್ಠ. ಡಾಕ್ಟರ್ ಲೂಯಿಸ್ ಲೂಮಿಯರ್ ಅವರು 1895ರಲ್ಲಿ ನಿರ್ಮಿಸಿದ ಈ ಶ್ರೇಷ್ಠ ಕರ್ಮವು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ಮಾದರಿಗಳಾದ ಓಪನ್ಎಐನ soar, ರನ್ವೇನ ಮೆಚ್ಚಿನ Gen-4, ಗೂಗಲ್ನ Veo-2 ಮತ್ತು ಕ್ವಾಯ್ಷೋನ Kling ಇಂತಹ ಮಾದರಿಗಳಿಂದ ಪರೀಕ್ಷೆಯ ಒಳಗೊಯ್ಯಲಾಗಿದೆ. ಕೃತ್ರಿಮ ಬುದ್ಧಿಮತ್ತೆಯು ಮೂಲ ಕೃತಿಯಂತೆ ಸಮಾನವಾಗಿ ಹರಿಯುವ ಮತ್ತು ಹಾಸ್ಯಗೊಳಿಸುವ ದೃಶ್ಯಗಳನ್ನು ರಚಿಸುತ್ತೆನೆ ಎಂದು ನಿರೀಕ್ಷಿತವಾಗಿದೆ.
ಅಸಲು ದೃಶ್ಯಗಳ ಪುನರ್ಗठन
ಉದ್ದೇಶವನ್ನು ಉತ್ತಮವಾಗಿ ತಲುಪುವಿಕೆಯೆಂದರೆ, ಸಿನಿಮಾ ನಾಲ್ಕು ಪ್ರಮುಖ ದೃಶ್ಯಗಳಲ್ಲಿ ಭಾಗಗಳನ್ನು ಕತ್ತರಿಸಲಾಗಿದೆ. ಪ್ರತಿ ದೃಶ್ಯವು ಮುಖ್ಯ ಕ್ಷಣಗಳನ್ನು ಹಿಡಿಯಬೇಕು: ಚೆನ್ನಿನ ತೋಟದ ನೀರಿನ ಚಚ್ಚಿಸುತ್ತಾ, ಹುಡುಗನ ನೀರಿನ ಹರಿವನ್ನು ತಡೆಯುವುದು, ತೋಟದತ್ತ ನೀರಿನ ತಾನು ತಿರುಗುವುದು ಮತ್ತು ಕೊನೆಗೆ, ಹುಡುಗನ ದಾಖಲಾದ ಪ್ರಯತ್ನ. ಪ್ರತಿ ವಿಭಾಗವು ಹಾಸ್ಯಭರಿತವಾದ ಶ್ರೇಷ್ಟಶೀಲತೆ ಹೊಂದಿದೆ, ಇದು ಮೊದಲ ಚಿತ್ರದ ಕೇಂದ್ರ ಭಾಗವಾಗಿದೆ.
ಓಪನ್ಎಐನ soar ನಲ್ಲಿ ಮೊದಲ ಪ್ರಯತ್ನಗಳು
ಮೊದಲ 접근ವು soarನ ಪಾರಂಪರಿಕ ಪಠ್ಯ-ಈ ವಿಡಿಯೋ ಮಾದರಿಯ ಮೇಲೆ ಆಧಾರಿತವಾಗಿತ್ತು. ಆದರೆ ಈ ಫಲಿತಾಂಶಗಳು ಕ್ಷೀಣರಾಗುತ್ತವೆ. ದೃಶ್ಯಗಳು ಸಂಪೂರ್ಣವಾಗಿ ವಾರ್ತಾನುಕೂಲವಾಗಿಲ್ಲ, ಪ್ರಾಥಮಿಕ ನಿರೀಕ್ಷೆಗಳನ್ನು ನಿರಾಶನಿಸುತ್ತವೆ. ಪರಿಹಾರವನ್ನು ಹುಡುಕುವಾಗ, ಶೋಧಕರು soarನಲ್ಲಿ ಇಮೇಜ್-ಬೇಸ್ಡ್ ವಿಡಿಯೋ ವಿಕಾಸ್ಗಾಗಿ ಸ್ವೀಕರಿಸಿದರು, ಅನಿವಾರ್ಯವಾಗಿ ಮಾದರಿಗಳಿಗೆ ಉತ್ತಮ ಸೃಷ್ಟಿ ಪಂದ್ಯವನ್ನು ಒದಗಿಸುತ್ತವೆ. ಆದರೆ, ಈ ವಿಧಾನವು ಸಾಧಾರಣ ಶ್ರೇಷ್ಟಶೀಲಾಭಿಯಾದಲ್ಲಿಯೂ ಯಶಸ್ವಿಯಾಗಲು ವಿಫಲವಾಗಿದೆ.
ಐಎ ಮೂಲಕ ನೆರವು ಪಡೆದ ವರ್ಣನೆ
ಅಸಂರೂಪಿತ ಫಲಿತಾಂಶಗಳಿಗೆ ಎದುರಾಗಿರುವ ಶೋಧಕರು ಮೂಲ ಚಿತ್ರದಿಂದ ನಿರೀಕ್ಷಿತ ದೃಶ್ಯಗಳನ್ನು ಬಳಸಿದರು. ಈ ಚಿತ್ರಗಳನ್ನು ಗೂಗಲ್ನಲ್ಲಿ Gemini Flash 2.0 Exp ಮೂಲಕ ವರ್ಣಿಸಿದ್ದರಿಂದ, ಉತ್ತಮ ಶ್ರೇಷ್ಟಶೀಲತೆಯನ್ನು ಪಡೆಯಿತು. ವರ್ಣನೆಗಳು ಚಿತ್ರದಲ್ಲಿ ಜೀವಂತ ಕರ್ಮವನ್ನು ಬದುಕಿಸಿದ ದೃಶ್ಯಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತವೆ, ಇದು ವಾಸ್ತವವಾಗಿ ಚಿತ್ರಗ್ರಹಣವನ್ನು ನೀಡಲು ಅವಕಾಶ ಮಾಡುತ್ತದೆ.
ರನ್ವೇನ Gen-4 ನಲ್ಲಿ ತಜ್ಞರ ಪರಿಶೀಲನೆ
ಜವಾಬ್ದಾರಿಗಳನ್ನು ನವೀಕರಿಸಲು, ಶೋಧಕರು ಮಾದರಿಯನ್ನು ಬದಲಾಯಿಸಿದರು, ರನ್ವೇನ Gen-4 ಗೆ ಹೋಗಲು. ವರ್ಣಿತ ಚಿತ್ರಗಳನ್ನು ಪ್ರಾರಂಭದ ಹಂತವಾಗಿ ಬಳಸಿಕೊಂಡು, ಅವರು ದೃಶ್ಯಗಳನ್ನು ಉಂಟುಮಾಡಲು ಪ್ರಯತ್ನಿಸಿದರು. ಸ್ವಲ್ಪ ಹೆಚ್ಚಿನ ಫಲಿತಾಂಶ ಬರುವಿದ್ದರೂ, ಪ್ರಯತ್ನಗಳು ಅಧಿಕ ನಿರೀಕ್ಷೆಗಳಿಗೆ ಶ್ರೇಷ್ಟ ಶ್ರೇಷ್ಟಶೀಲತೆಗಾಗಿ ಕಡಿಮೆ ಎಂದು ಪರಿಗಣಿಸಲಾಯಿತು. ಉದಾಹರಣೆಗೆ, ಎರಡನೆಯ ದೃಶ್ಯವು ನಿರೀಕ್ಷಿತ ದೃಷ್ಟಿಯಿಂದ ಅತಿಯಾದ ದೋಟದ ಉಲ್ಲೇಖವನ್ನು ಪ್ರತ್ಯಕ್ಷಗೊಳಿತ್ತದೆ ಮಿತಿಯೂ ಹೊಂದಿಲ್ಲ.
ಗೂಗಲ್ ಡೀಪ್ಮಿಂಡ್ನ Veo-2 ನಲ್ಲಿ ಪ್ರಯೋಗ
ಗೂಗಲ್ ಡೀಪ್ಮಿಂಡ್ನ Veo-2 ಅನ್ನು ಮಂಜೂರಾತಿಯ ಅನುಕ್ರಮವನ್ನು ಉತ್ತಮಗೊಳಿಸಲು ಪರಿಚಯಿಸಲಾಯಿತು. ಈ ಮಾದರಿಯು ಹೆಚ್ಚು ನಿಖರವಾದ ಸಾಮರ್ಥ್ಯವನ್ನು ಒದಗಿಸುತ್ತದೆ, ಸ್ಫೂರ್ತಿಯ ಪೋದ್ಗಳಿಗೆ ಹೆಚ್ಚು ಗತಿಸೂತ್ರ ಒದಗಿಸುತ್ತದೆ. ದೃಶ್ಯಗಳು ಜೀವಂತದ್ದಾಗಿ ಕಾಣಿಸುತ್ತವೆ, ಆದರೆ ಮುಖಗಳು ಮತ್ತು ಪಾತ್ರೆಗಳ ಉಡುಪುಗಳಲ್ಲಿ ಕೆಲವು ನಿರಂತರತೆಗೆ ಸಂಬಂಧಿಸಿದ ಸಮಸ್ಯೆಗಳು ಇವೆಯಾದರೆ ಹೋಗಿ ಪೋಲಿಸಿತ್ತು.
ಫಲನ ಮತ್ತು ಅಂತಿಮ ಮೌಲ್ಯಮಾಪನ
ಅಂತಿಮ ಹಂತವು Gemini ನಿರ್ಮಿಸಿದ ಚಿತ್ರಗಳನ್ನು ಪುನರ್ಮೌಲ್ಯ ಮಾಡುವುದು, ಅವುಗಳನ್ನು ಉತ್ತಮಗೊಳಿಸಲು ಅದನ್ನು ಈ ಸ್ಥಾನದಲ್ಲಿ ಮುಂದುವರಿಸುತ್ತದೆ. ಪ್ರತಿ ದೃಶ್ಯವು Kuaishouನ Kling 2.6 ಮಾದರಿಗೆ ಒಳಪಡಿಸಲಾಗುತ್ತದೆ, ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲ성과 ಮೂಲ ಕೃತಿಯ ಗೌರವವಾದ ನಿರೀಕ್ಷೆಯನ್ನು ಹೊಂದಬಹುದು ಎಂಬ ಆಶೆಯಲ್ಲಿ. ಫಲಿತಾಂಶಗಳು ಸರಳವಾಗಿ ಫೋಟೋ-ಯದೃಷ್ಟವಾದವು, ಆದರೆ ಕಥನವಿಷಯದಲ್ಲಿ ಕಡಿಮೆ ಸಮರ್ಥನೀಯವಾಗಿಯೇ ಕಾಣಿಸುತ್ತವೆ. ದೃಶ್ಯಗಳ ನಡುವೆ ಬದಲಾವಣೆಗಳು ಹಾಗೆ ಹೆಚ್ಚು ವ್ಯಕ್ತವಾಗಿದ್ದು, ಕಥೆಯ ನಿರಂತರತೆಗೆ ಅನುಪಾತಕ್ಕೆ ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲತೆಯ ಯಾವುದೇ ಪ್ರಶ್ನೆ ಕೇಳುತ್ತದೆ.
ಹಿರಿಯ ಶ್ರೇಷ್ಟ ಶ್ರೇಷ್ಟವಾದ ಮೇಲೆ, verdict ಬಂದಿದೆ: ಚಿತ್ರಗಳನ್ನು ಪುನರುಚಿಸುವುದು, ಮೊದಲದ್ದಾದರೂ, ನಿಮ್ಮ ದೊಡ್ಡ ಕೆಲಸವನ್ನು ಬೇರೆಯಾದ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಗಳಿಗೆ ತಂತ್ರೂಪವಾಗಿ ಸ್ಥಾನವಾಗುತ್ತದೆ. ಈ ಪ್ರಯತ್ನಗಳು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ವಿಡಿಯೋ ಕ್ಷೇತ್ರದ ಮೃತ್ಯುಗಳನ್ನು ಬೆಳಗಿಸುತ್ತವೆ, ಆದರೆ ಇದು ವೇದಿಕೆಯಾದ ಮಾತ್ರವಲ್ಲ. ಶೋಧಕರು, ಶ್ರೇಷ್ಟ ಶ್ರೇಷ್ಠಶೀಲತೆಯ ಮೂಲಾಧಾರಗಳೊಂದಿಗೆ, ತಮ್ಮ ಉಪಾಧಿಗಳನ್ನು ಮುಂದುವರಿಸುತ್ತಿದ್ದಾರೆ, IA ಗೆ ಹೊಸ ಶ್ರೇಷ್ಟ ಶ್ರೇಷ್ಠಶೀಲತೆಯನ್ನು ತಲುಪುವುದಕ್ಕಾಗಿ ಮತ್ತೊಮ್ಮೆ ನಿರೀಕ್ಷಿಸುತ್ತಾರೆ.
ಐಎ ಬಳಸುವುದು ಕುರಿತ FAQ ಪ್ರಧಾನ ಚಿತ್ರವನ್ನು ಪುನರುಚಿಸುವ
ಏಕೆ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ “L’Arroseur arrosé” ಅನ್ನು ತಾಕತ್ತಿಯಾಗಿ ಪುನರುಚಿಸಿದರು?
ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ಅವಾಕ್ಷೇತ್ರ ತಂತ್ರಜ್ಞಾನವು ಇನ್ನೂ ಪ್ರಯೋಗಶೀಲ ಹಂತದಲ್ಲಿದೆ. ನಿರೀಕ್ಷಿತ ಸಂಕಲನದ ಕ್ರಮವನ್ನು ಹಿಡಿಯಲು ಮಾದರಿಗಳು ಮೋಸ ಹಾಕಲು ಸಾದ್ಯವಾಗಿದ್ದು, ಈಪಾತ್ರೆಯ ಅಂತಿಮ ಗ್ರಾಮದಲ್ಲಿ ಹಾಸ್ಯವಿಲ್ಲ.
ಈ ಪ್ರಯತ್ನದಲ್ಲಿ ಬಳಸಿದ ಶ್ರೇಷ್ಠ ಶ್ರೇಜ್ಞ ಮಾದರಿಗಳು ಯಾವುವು?
ಓಪನ್ಎಐನ soar, ರನ್ವೇನ Gen-4, ಗೂಗಲ್ನ Veo-2 ಮತ್ತು ಕ್ವಾಯ್ಷೋನ Kling ಎಂಬ ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲತಾ ಮಾದರಿಗಳು ಪ್ರಯತ್ನಿಸಿದ್ದಾರೆ.
ಈ ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲತೆಯ ಘಟಕರು ಏನು?
ಒಂದು ಪ್ರಾಮುಖ್ಯತೆಯಾದ ಸಮಸ್ಯೆ ಇರಬಹುದು, ದೃಶ್ಯದ ಪ್ರಯೋಜನದಲ್ಲಿ ಹೇಗೆ ಬೆಂಗಳೂರಿಗೆ ಮಾರಣಾಂತಿಕ ತೊಂದರೆಗಳ ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲತೆಯಲ್ಲಿ ಪರಿಗಣಿಸುತ್ತವೆ, ಕಾರ್ಯದಲ್ಲಿ ಅಂದಾಜಿಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ, ಹಾಗೂ ಕ್ರಮದಲ್ಲೂ ಕಾರಣ ಮಾಡುವುದಾಗಿ ಹೇಳುವುದು ಬಹಳ ಬುಡವು ಎಷ್ಟೇ ಪ್ರಾಮುಖ್ಯ ಕಾಣುತ್ತದೆ.
ನೀವು ವಿಡಿಯೋ ಉತ್ಪಾದನೆಯ ಪ್ರಯೋಗವನ್ನು ಹೇಗೆ ಹೊಂದಿಸಿದ್ದೀರಿ?
ಮೂಲ ಸಿನಿಮಾ ದೃಶ್ಯವು ನಾಲ್ಕು ಮುಖ್ಯ ಭಾಗಗಳಿಗೆ ಪ್ರತ್ಯೇಕವಾಗಿ ಕಡಿದಾಗಿದೆ, ಪ್ರತಿ ಕ್ರಿಯೆಯ ವಿವರಣೆಯ ಒತ್ತಳೆಯೆಂದರೆ ಸ್ಪಷ್ಟವಾದ ಮೂಲಾಡಾರವನ್ನು ನೀಡಲು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ನೀಡಲಾಗಿದೆ.
ಮಾದರಿಗಳಿಗೆ ಅದನ್ನು ಆಹಾರ ಕೈಯ ಸೇವನೆಯಿಂದ ಏನು ಪ್ರದರ್ಶನ ನೀಡಲಾಗುತ್ತದೆ?
ಎಲ್ಲಾ ದೃಶ್ಯದ ದೃಶ್ಯಗಳನ್ನು ಉದಾಹიწყಿಸಲು ಮೂಲ ಚಿತ್ರದಲ್ಲಿ ಅವು ಜೀವಂತಗೊಂಡಿವೆ.
ಪರೀಕ್ಷೆಗಳ ಕುರಿತಾದ ಯಾವ ಶ್ರೇಷ್ಠ ಪಟ್ಟಿಯಾಗುವುದು?
Veo-2 ರಿಂದ ಅಂಗೀಕಾರವು ಕಾರಣವಾಗುತ್ತದೆ, ಸಾಕಷ್ಟು ಶ್ರೇಷ್ಠ ಶ್ರೇಷ್ಠಶೀಲತೆಗೆ ಪರಿಗಣಿಸುತ್ತೆನೆ.
ಈ ಚಿತ್ರವನ್ನು ಪುನರುಚಿಸಲು IA ಬಳಸುವುದು ಏಕೆ “ಧೋಖಾ” ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ?
ಮೂಲ ಚಿತ್ರಿನ್ನು ತೆಗೆದುಕೊಂಡು, ಇದರ ಕರಿಗೆಯಲ್ಲ ಸಮಸ್ಯೆಗಳ ಮಾರ್ಗಗಳನ್ನು ಪಡೆದುಕೊಂಡವು, ಇದು ಮೂಲ ಕೃತಿಯಲ್ಲಿ ನಿಖರವಾದ ವಿನ್ಯಾಸವನ್ನು ಪಡೆಯಲು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಬಳಸಿ ಸಂಪೂರ್ಣ ನೀತಿ ಅಗತ್ಯವಿರಬಹುದು.
ಈ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಪ್ರಯತ್ನದಿಂದ ಯಾವ ಪಾಠಗಳು ಬರುತ್ತವೆ?
ಮಾಡಲಾದ ಬಹಳಷ್ಟು ತಂತ್ರಜ್ಞಾನಗಳಲ್ಲಿ ವೈಜ್ಞಾನಿಕ ತಂತ್ರಜ್ಞಾನವು ಶ್ರೇಷ್ಠ ಕರ್ಮವನ್ನು ಹೆಸರಿಸುತ್ತಿಲ್ಲ, ಇದು ಶಾಸನ ಮತ್ತು ಹೆಚ್ಚಿನ ಕ್ಷೇತ್ರದಲ್ಲಿ ಆವಶ್ಯಕತೆ ಬೆಳಗಿಸುತ್ತದೆ.
IA ವಿಡಿಯೋ ಅಭಿವೃದ್ಧಿಯ ಲಾಭ ಆಡುವಿಕೆ ದೊರೆಯುತ್ತದೆಯೇ?
ಹೌದು, ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮಾದರಿಗಳು ಮುಂದುವರಿವಾಗ ಉತ್ತಮ ಸಂಜೆಗಳನ್ನು ಸೇರುವ ಸಾಧ್ಯೋರಾಗ ಪ್ರಸಾರವಾಗಿ ಇರುವುದೆಂಬ ತೀಕ್ಷ್ಣ ಆಶಾಕರ ಸಂದೇಶವನ್ನು ನೀಡುತ್ತದೆ.