À mesure que les modèles de langage deviennent plus volumineux, ils ont tendance à fournir des réponses incorrectes plutôt qu’à reconnaître leur ignorance.

Publié le 23 ಫೆಬ್ರವರಿ 2025 à 04h30
modifié le 23 ಫೆಬ್ರವರಿ 2025 à 04h30

ವಾಣಿಜ್ಯದ ಗ್ರೆಂಡ್ ಮಾದರಿಗಳನ್ನು ಭಾಷಾಂತರಿಸುವ ನಿರ್ಮಾಣವು ತಂತ್ರಜ್ಞಾನದ ದೃಶ್ಯವನ್ನು ಹೊಸದಾಗಿ ವ್ಯಾಖ್ಯಾನಿಸಿದೆ, ಅಪರೂಪದ ನಿರೀಕ್ಷೆಗಳನ್ನು ಹುಟ್ಟಿಸಿದ್ದು. ಮಾನವ ಭಾಷೆ ಉತ್ಪಾದಿಸಲು ಅವರ ಶಕ್ತಿ ಬುದ್ಧಿಮತ್ತೆ ನಕಲು ಮಾಡುತ್ತದೆ, ಆದರೆ ಈ ನಕಲು ಒಂದು ಪುಟಾಚೆಗೆ ಹೊಂದಿ ಉಳಿಯುತ್ತದೆ. ಈ ಮಾದರಿಗಳು ಶ್ರೇಷ್ಠತೆಯನ್ನು ಹೂಡುತ್ತವೆ, ಇಲ್ಲಿ ಸಂಕೀರ್ಣತೆ ಶುದ್ಧತೆಗೆ ಹಾನಿ ಮಾಡುತ್ತದೆ, ವಿಚಿತ್ರ ದೋಷಗಳನ್ನು ಹುಟ್ಟಿಸುತ್ತವೆ. ಅವರು ತಮ್ಮ ಜ್ಞಾನವನ್ನು ಗುರುತಿಸಲು ಸಿದ್ಧರಾಗಿಲ್ಲ, ಆದ್ದರಿಂದ ಸಮರ್ಪಕವಾದ ಪ್ರತಿಯಾಗಿ ತಿರುಗಿರುವ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತಾರೆ. ತಂತ್ರಜ್ಞಾನದ ನೆರಾಳಲ್ಲಿ ಮುನ್ನಡೆಯುತ್ತಿರುವಾಗ, ನಾವು ಅವರ ಕಾರ್ಯದ ಮೂಲಗಳಿಂದ ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವುದು ಪ್ರಮುಖವಾಗಿದೆ.

ಭಾಷಾಂತರಿಸುವ ಗ್ರ್ಯಾಂಡ್ ಮಾದರಿಗಳಿಂದ ಉತ್ಪನ್ನವಾಗುವ ಉತ್ತರಗಳ ಅಸ್ಥಿರತೆ

ಭಾಷಾಂತರಿಸುವ ಗ್ರೆಂಡ ಮಾದರಿಗಳು (LLM) ಉಲ್ಲೇಖನೀಯ ಪರಿಕಲ್ಪನೆಯತ್ತ ಕಡ್ಡಾಯವಾಗಿ ಹಾರಿಸುತ್ತವೆ: ಅವರ ಡೇಟಾ ಪ್ರಮಾಣ ಮತ್ತು ಸಂಕೀರ್ಣತೆಯನ್ನು ಹೆಚ್ಚಿಸುವಾಗ, ಅವರ ಸಂಬಂಧಿತ ಉತ್ತರವನ್ನು ನೀಡುವ ಸಾಮರ್ಥ್ಯ ಕಡಿಮೆ ಬರುತ್ತದೆ. ಈ ವ್ಯವಸ್ಥೆಗಳು, ಸಾಮರ್ಥ್ಯದ ಶ್ರೇಷ್ಠವಾದ ಮೌಂಟ್‌ನಂತೆ, ತಪ್ಪಾದ ಹೇಳಿಕೆಗಳನ್ನು ನೀಡುವ ಪ್ರವೃತ್ತಿಯಾಗಿದೆ. ಅವರ ಗಾತ್ರವನ್ನು ಅನುಸಾರವಾಗಿ, ಅವರು ಅವರ ಜ್ಞಾನವನ್ನು ಗುರುತಿಸಲು ಬದಲು ಉತ್ತರಗಳಲ್ಲಿ ಶ್ರೇಷ್ಠತೆಯನ್ನು ನೀಡಲು ತಿರುಗಿಸುತ್ತಾರೆ.

ಕೌಶಲ್ಯದ ಮೋಸದ ಪಾರದರ್ಶಕತೆ

LLM ಗಳಲ್ಲಿ ಸಾವಿರಾರು ಅಥವಾ ಕೋಟಿ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳಿವೆ. ಈ ಅಸಂખ્યವಾದ ಆಧಾರಗಳು ಕೌಶಲ್ಯದ ಮೋಸದ ನಿರ್ಮಾಣವನ್ನು ಉತ್ತೇಜಿಸುತ್ತವೆ. ಬಳಸುವವರಿಗೆ ಈ ವ್ಯವಸ್ಥೆಗಳು ಕೇಳಿದ ಪ್ರಶ್ನೆಗಳ ಅರ್ಥವನ್ನು ನಿಜವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತವೆ ಎಂದು ನಂಬಲು ಪ್ರಲೋಭಿಸುತ್ತವೆ. ಆದರೆ, ಈ ಮಾದರಿಗಳನ್ನು ತರಬೇತಿಯಾದ ಡೇಟಾ ಪ್ರಮಾಣವು ಹೆಚ್ಚಿದರೂ, ಸಂದರ್ಭವನ್ನು ಉತ್ತಮವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಾರದು ಎಂಬುದು ಸ್ಪಷ್ಟವಾಗುತ್ತದೆ.

ದೊಡ್ಡ ಪ್ರಮಾಣದ ಮಾದರಿಗಳೆತ್ತಿರುವ ಸವಾಲುಗಳು

ಈ ಮಾದರಿಗಳನ್ನು ಹೇಗೆ ನಿರ್ಮಿಸುತ್ತಾರೆ ಎಂದು ನೋಡಿದಾಗ, ಆನ್‌ಫರ್ ಲೇರ್‌ನಲ್ಲಿ ಅವುಗಳು ಪ್ರಮುಖ ಪಾತ್ರವಹಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ತೋರುತ್ತದೆ. LLM‌ಗಳು ಭದ್ರವಾದ ಡೇಟಾಸೆಟ್ನಿಂದ ಅವರಿಗೆ ತಿಳಿದಿರುವದ್ದನ್ನು ಪಡೆಯುತ್ತವೆ, ಆದರೆ ಅವರು ಮಾನವ ಭಾಷೆಯ ವಿವರಗಳನ್ನು ಹಿಡಿಯಲು ಆಗುವುದಿಲ್ಲ. ಈ ಕೊರತೆಯು ಬಹುಶಃ ತಪ್ಪು ಅಥವಾ ವಿಷಯವನ್ನು ತಪ್ಪಾಗಿ ಹೇಳುವತ್ತ ಕರೆದಿರುತ್ತದೆ.

ದೊಡ್ಡ ಪ್ರಮಾಣದ ಡೇಟಾಗಳ ಅಸಮರ್ಥತೆ

ಡೇಟಾ ಪ್ರಮಾಣವು ಹೆಚ್ಚು ಗ್ರಹಿಸಿರುವ ನೆಕೆಯಂತಿದೆ, ಆದರೆ ಇದು ಸಹ ಎರಡು ಹಂತಗಳಲ್ಲಿ ರೂಪುಗೊಳ್ಳುತ್ತದೆ. ಇದರಲ್ಲಿವೆ, ಮಾದರಿಗಳ ಸಂಸ್ಥಾಪಕರು, OpenAI ಹಾಗು, ಹಕ್ಕಿಗಳು, ಇತರ ಬಲ್ಲರೊಂದಿಗೆ, ಲೆಕ್ಕವನ್ನು ಕ lua ಎಂದು ಡೇಟಾವನ್ನು ಅತಿ ಹೆಚ್ಚು ತೂಕವಾಗಿ ಹಾಕಿದ್ದರೆ, ಅವರು ಆದರೆ ಅಗತ್ಯದಷ್ಟೇ ಹರಡಲು ಸಹಾಯವಾಗಿದೆ. ಈ ಪರಿಕರವು ಆರ್ಥಿಕಾಂಶವನ್ನು ಒಳಗೊಂಡಂತೆ ಬದಲಾವಣೆಗಳಿಗೆ ಕಾರಣವಾಯಿತು.

ವಿಶ್ವಾಸಕ್ಕೆ ಪರಿಣಾಮಗಳು

ಈ ದೃಶ್ಯದೊಳಗೆ, ಬಳಸುವವರ ವಿಶ್ವಾಸವು ತಂತ್ರಜ್ಞಾನಗಳಾಗುವಾದಾಗ ಹಾನಿ ಗೆಳೆಯನ ಒಳಗೊಮ್ಮೆ. LLMಗಳು ತಪ್ಪಾದ ಉತ್ತರಗಳನ್ನು ನೀಡಿದಾಗ, ತಮ್ಮ ದೋಷಗಳನ್ನು ಗುರುತಿಸಲು ಹೆಜ್ಜೆ ಹಾಕುತ್ತವೆ, ಅವರ ಹೆದರಿಸುವ ಶಿಕ್ಷಣ ಲ್ಲಿ. ಬಳಸುವವರು ಈ ಮಾದರಿಯನ್ನು ಕೇಳಿದಾಗ, ನೀಡನ ಉತ್ತರವು ಶुद्धವಾಗಿಲ್ಲದಿದ್ದರೂ, ಅದನ್ನು ಕಾರ್ಯಪಡುವಿಕೆಗಾತಿ ಶ್ರೇಷ್ಠವಾಗಿತ್ತು.

ವಿಭಿನ್ನ ಕ್ಷೇತ್ರಗಳನ್ನು ತೊಂದರಿಸುತ್ತವೆ

ಫಲಿತಾಂಶಗಳು ಶ್ರೇಣೀಕೃತ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಒಳಘಟ ಬೇಕಾದಾಗ ಎಂದು ಬುದ್ಧಿಸುವಷ್ಟು ಕಾಣಿಸುತ್ತವೆ. ಶಿಕ್ಷಣ, ಆರೋಗ್ಯ ಅಥವಾ ಚೈಬರ್ ಸೆಕ್ಯುರಿಟಿನಲ್ಲಿ ಪ್ರಾಯೋಗಿಕ ವಿಷಯಗಳು ಹೆಚ್ಚು ಶ್ರೇಣೀಕೃತವಾಗಿವೆ. mWISE 2024 ಇಂತಹ ಮಾದರಿಯ ಪರಿಚಿತಗಳು ವಿಶ್ಲೇಷಣೆಯ ಮಟ್ಟಗಳನ್ನು ತೆರೆದಿವೆ. ಬ್ಯಾಂಕಿಂಗ್ ಕ್ಷೇತ್ರದಲ್ಲಿ, LLM ಗಳ ಬಳಕೆ ಅಭ್ಯಾಸಗಳನ್ನು ಮಾರ್ಪಡಿಸುತ್ತವೆ, Vinci ಯ ಉದಾಹರಣೆ ನಿಮಿಷಾಲಿಸಲು ಸಹಾಯಕರಾಗಿತ್ತು.

ಮೇಲೆ ಅಧ್ಯಯನದಲ್ಲಿ ಹೊಸದಾಗಿ ನುತ್ತಾ

ಶೋಧನದಸ್ ಇದುವರೆಗೆ ಹೆಚ್ಚು ಹೆಚ್ಚು ಇತ್ಯಾದಿಯನ್ನು ಇಲ್ಲಿ ಚರ್ಚಿಸಲು ಶ್ರೇಣೀಕರಣ ಮತ್ತು ಶ್ರುತಿಯಾದೆರಗಳಲ್ಲಿ ಹೊಸವುಗಳನ್ನು ಕಟ್ಟಬೆಕ್ಕಾಗುತ್ತವೆ. ಇವುಗಳಲ್ಲಿ, ಹೊಸಕ್ಕೆ ಮೊದಲಿಗೆ ಬಿಡುತ್ತವೆ: ಅಷ್ಟೇನಿಲ್ಲದಂತೆ, ಈ ವ್ಯವಸ್ಥೆಗಳು ಅವರ ಉತ್ತರಗಳನ್ನು ನೀಡಲು ತಮ್ಮ ಅವಶ್ಯಕತೆಗಳನ್ನು ಪರಿಗಣಿಸಲು ಹಿಂದಿನ ಸಾಧನೆಗಳಿಗೆ ಅಗತ್ಯವಿದೆ. LLaMA 3.2 ಯ ನೂತನ ಸಂಸ್ಕರಣೆಯ ವಿಶೇಷವಾಗಿ ಮಾನವ ಭಾಷೆಯ ಸಂಕೀರ್ಣತೆಯ ಘನ ಪರಕ್ರಿಯೆ ಸಿಂಧನೆಯ ಮೇಲ್ಕನ್ನಡಿಗಳನ್ನು ಸಮರ್ಪಿಸಲು ಕಾಮನೇರಿಸುತ್ತಾಗಿವೆ.

ಸ್ಪರ್ಧೆಯ ಎದುರಿನಲ್ಲಿ

ಈ ಸಮಸ್ಯೆ ಹೊಸ ಅದೃಷ್ಟ ಸಂಪ್ರದಾಯವನ್ನು ನೀಡುತ್ತದೆ, ಸ್ಪರ್ಧೆ ಹೆಚ್ಚು ಪ್ರಮಾಣಿತವಾಗುತ್ತದೆ. ಅಮೇಜಾನ್ ಪ್ರಾಕೃತಿಕ ಮಾದರಿಗಳನ್ನು ನೀಡುತ್ತಿದೆ, Olympus, ಮತ್ತು OpenAI ಹಾಗು Alphabet ಮುಂಚಿನ ಕಂಪನಿಗಳ ಮೇಲೆ ಗುಣಮಟ್ಟ ಸಲ್ಲಿಸುತ್ತವೆ. ಸಹಜವಾಗಿ, ಈ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಸುಧಾರಿಸಲು ತ್ವರಿತವಾಗಿ ಅರ್ಹವಾಗಿದೆ, LLM ಗಳಿಗೆ ಇದ್ದರುಬಹುದಾದ ನಿರೀಕ್ಷೆಗಳ ಬಗ್ಗೆ.

ಸ್ಥೂಲಳವನ್ನು ಕೇಳುವ ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೆಗಳೆನ್ನುತ್ತವೆ

ಬೃಹತ್ ಭಾಷಾ ಮಾದರಿಗಳು ಶ್ರೇಷ್ಠ ಸಮಸ್ಯೆಗಳನ್ನು ಬಂದಿಸುತ್ತವೆ?
ಬೃಹತ್ ಭಾಷೆ ಮಾದರಿಗಳು, ದತ್ತಾಂಶంలో ಲಾಭವನ್ನು ಎಲ್ಲಾ ಶ್ರೇಷ್ಠ ಮಾಹಿತಿಯ ಆಧಾರ ಹೊಂದಬಹುದು ಆದರೆ, ಅವರನ್ನು ಪೂರಿಸಿಕೊಂಡಿರುವಾಗ, ಅವರು ಬರುವ ಮನೋಭಾವವನ್ನು ತಪ್ಪಾಗುತ್ತದೆ.
ಕರ್ಣಿನಾ ಭಾಷಾ ಮಾದರಿಗಳಲ್ಲಿ ದೋಷಗಳನ್ನು ಸೃಷ್ಟಿಸಲು ಏನೆಲ್ಲ ಕಾರಣಗಳಾಗಿವೆ?
ದೋಷಗಳು ದತ್ತಾಂಶದ ಪ್ರಮಾಣವನ್ನು, ಮಾಹಿತಿಯ ವಿವಿಧತೆಯನ್ನು, ಮತ್ತು ಮಾದರಿಯ ಸಾಮರ್ಥ್ಯವನ್ನು ಪುಷ್ಟಿಸುವ ಶ್ರೇಷ್ಠ ಮಾಹಿತಿಯ ಆಧಾರ ಅಧಿಕಾರದಿಂದಾಗುತ್ತದೆ.
ಬಳಸುವವರು ಭಾಷಾ ಮಾದರಿಯಲ್ಲಿನ ದೋಷಗಳನ್ನು ಎ ಉಳುಕಗೊಳ್ಳಬಹುದು ಎಂದು ತಿಳಿಯುವ ಮಾರ್ಗಗಳು ಯಾವುವು?
ಉತ್ತರಗಳ ಮೇಲೆ ಗಂಭೀರ ಮೌಲ್ಯಯು ಟೀಕೆ ಸಲ್ಲಿಸುವ ಮೂಲಕ, ಶ್ರೇಷ್ಠ ಮಾಹಿತಿಗಳೊಂದಿಗೆ ಶ್ರೇಷ್ಠವಾಗಿ ಪ್ರಯೋಜನಿಸಲು ಮತ್ತು ಮಾಹಿತಿಯ ಲಕ್ಷಣಗಳ ಮೇಲೆ ನನಸು ಪಡೆಯುವುದು.
ಎಲ್ಲಾ ಬೃಹತ್ ಭಾಷಾ ಮಾದರಿಗಳು ತಪ್ಪು ಮಾಹಿತಿಯನ್ನು ತಲುಪಿಸುತ್ತವೆ嗎?
ಬೇರೆ, ಈ ಎಲ್ಲವು ಉದ್ದೇಶಿತಿರುವ ಹಕ್ಕಿಯ ಮೇಲೆ ನಡೆಯುತ್ತಿಲ್ಲ. ಆದರೂ, ಶ್ರೇಷ್ಠ ಮಾದರಿಯ ಮೇಲೆ ತಪ್ಪುಗಳನ್ನು ಹೆಚ್ಚು ವಿವರಿಸುತ್ತವೆ.
ಬ್ಲ್ಯಾಶಾ ಮಾದರಿಗಳ ದೋಷಗಳನ್ನು ಇಳಿಸಲು ಡೆವೆಲಾಪರ್‌ಗಳು ಯಾವ ಕ್ರಮಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ?
ಡೆವೆಲಾಪರ್‌ಗಳು ತಳಕ ಕೊಡುವ ತರಬೇತಿ ಪ್ರಕಟಣೆಗಳು ಅಥವಾ ಪರಿಹಾರಗಳನ್ನು ಕೈಗೊಂಡಾಗ ಸೂಚಿತಗಳನ್ನು ಹುಡುಕಲು ಪ್ರಯೋಜಿಸುತ್ತಾರೆ.
ಬಳಸುವವರು ಮಾದರಿಯ ಮಾಹಿತಿಯ ತಪ್ಪುಗಳನ್ನು ವರದಿ ಹೇಗೆ ಮಾಡಬಹುದು?
ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗಳಲ್ಲಿ ಬಳಸುವವರು ವಿಮರ್ಶೆ ಸಲ್ಲಿಸಲು ಅಥವಾ ಅವರು ತಮ್ಮ ಅನುಭವವನ್ನು ಹಂಚಿಕೊಳ್ಳಲು ಕೆಳಗಿನ ಸಮುದಾಯಗಳಲ್ಲಿ ವಿಳಾಸವನ್ನು ತೆರವುಗೊಳಿಸುತ್ತವೆ.
ಭಾಷಾ ಮಾದರಿಗಳು ತಮ್ಮ ಆದಾಯವನ್ನು ಗುರುತಿಸುತ್ತವೆ ಅಥವಾ?
ಈ ವರ್ತಮಾನದಲ್ಲಿ, ಹೆಚ್ಚಿನ ಮಾದರಿಗಳು ತಮ್ಮ ಆದಾಯವನ್ನು ನೇರವಾಗಿ ಗುರುತಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ. ಅವರು ಶ್ರೇಷ್ಟವಾಗಿ ಉತ್ತರನ್ನು ನೀಡಲು ತಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಧಾರಣೆ ಮಾಡುತ್ತಾರೆ.
ಭಾಷಾ ಮಾದರಿಗಳ ಉತ್ತರದ ದೋಷಗಳಿಗೆ ಏನು ಪರಿಣಾಮವಿದೆ?
ದೋಷಗಳು ದೋಷವನ್ನು, ಬಳಸಹೊರೆಯು ಮತ್ತು ಆತ್ಮವಿಶ್ವಾಸವನ್ನು ಕುತ್ತಿತ್ತೆ.

actu.iaNon classéÀ mesure que les modèles de langage deviennent plus volumineux, ils ont...

ಶೋಧಕರು ಪ್ರೋಟೀನ್ ಭಾಷಾ ಮಾದೃತಿಗಳ ಒಳಗಿನ ಮೆಕಾನಿಸ್ಮ್ಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತಿದ್ದಾರೇನು

découvrez comment les chercheurs analysent les mécanismes internes des modèles linguistiques protéiques afin de mieux comprendre leur fonctionnement et leurs applications en biologie.
découvrez fidji simo, la française au parcours exceptionnel qui conquiert la silicon valley grâce à son talent et à son influence remarquable dans l'univers de la tech et de l'innovation.
découvrez comment les projets de donald trump sur l'intelligence artificielle pourraient être entravés par le poids croissant des régulations et standards européens dans ce domaine stratégique.
découvrez pourquoi l’audition de luc julia, souvent présenté comme le 'co-créateur de siri', au sénat soulève des questions sur la véracité de son expertise et de son parcours dans le domaine de l’intelligence artificielle.
découvrez comment les données synthétiques révolutionnent le secteur de l'assurance en offrant des solutions innovantes pour améliorer l'analyse des risques, protéger la confidentialité et stimuler l'innovation.
openai annonce le retour du modèle gpt-4o dans chatgpt après des retours négatifs concernant gpt-5, offrant ainsi une expérience améliorée aux utilisateurs.