ಒಂದು ಸ್ವಯಂ-ಅನುಕೂಲಿತ LLM ಹೊಸ ಕಾರ್ಯಗಳನ್ನು ಮುಟ್ಟಲು ತನ್ನ ಭರ್ತಿಯನ್ನು ಜ್ವರಗೊಳಿಸುತ್ತದೆ

Publié le 19 ಫೆಬ್ರವರಿ 2025 à 01h33
modifié le 19 ಫೆಬ್ರವರಿ 2025 à 01h33

ಭಾಷಾ ಮಾದುರಿಕೆಯ contemporary ಸಮಸ್ಯೆಗಳಿಗೆ ಹೊಂದಿಕೊಳ್ಳುವ ಸಾಮರ್ಥ್ಯವು ಸಂಶೋಧಕರಿಗೂ ವ್ಯವಹಾರಿಗಳಿಗೂ ಆಕರ್ಷಿತವಾಗುತ್ತಿದೆ. ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLMs ನಿರಂತರವಾಗಿ ಬದಲಾಗುತ್ತಿರುವ ಬೇಡಿಕೆಗಳಿಗೆ ದೃಷ್ಟಿಕೋಣವನ್ನು ಹೆಚ್ಚು ಉಲ್ಲೇಖಿಸುತ್ತವೆ. ಇವುಗಳು *ಗತಿಶೀಲವಾಗಿ* ಹೊಸ ಕಾರ್ಯಗಳನ್ನು ಆಳಲು ತಮ್ಮ ತೂಕಗಳನ್ನು ಹೊಂದಿಸುತ್ತವೆ, supervised learning ಯ ಪರಂಪರೆಯನ್ನು ವಿಭಜಿಸುತ್ತವೆ.
*ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ* ಈ ಸುಗಮ ವಿಧಾನದಿಂದ ಹೆಜ್ಜೆಯುಚ್ಛ ಗಡಿಗಳಿಗೆ ಒಯ್ಯಲ್ಪಡುತ್ತದೆ, ಪ್ರದರ್ಶನದಲ್ಲಿ ತೀವ್ರ ಸುಧಾರಣೆಯನ್ನು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ. ಹೊಸ ಮಾಹಿತಿಗಳಿಂದ modelನ್ನು ತರಬೇತಿ ನೀಡುವ ಸಾಧ್ಯತೆಯು ಉಳಿದ ಸಂಪತ್ತುಗಳನ್ನು ಉಳಿಸುವ ಮೂಲಕ ಕ್ರಾಂತಿಕಾರಿ ತProgressವಾಗಿದೆ. ಆದ್ದರಿಂದ ಪರಂಪರागत ವಿಧಾನಗಳ ಸೀಮಿತತೆಗೆ ಸಂಬಂಧಿಸಿದ ಸವಾಲುಗಳನ್ನು ಕ್ರಮೇಣ ಮುಕ್ತಾಯಗೊಳಿಸುತ್ತವೆ.

ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ನ ಅಭಿವೃದ್ಧಿ

Sakana AI ನ ಸಂಶೋಧಕರು, ಜಪಾನಿನ ಸ್ಟಾರ್ಟ್‌ಅಪ್, ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಅನ್ನು Transformer² ಎಂದು ಹೆಸರಿಸಿದ್ದಾರೆ. Qi Sun, Edoardo Cetin ಮತ್ತು Yujin Tang ರವರಿಗೆ ನಿರ್ದೇಶಿಸಲು ಈ ಪ್ರಗತಿ arXiv ಸರ್ವರ್‌ನಲ್ಲಿ 2025 ಹಬ್ಬರಿಯಲ್ಲಿ ಪ್ರಕಟಿಸಲಾಯಿತು. ಈ ಹೊಸ ಮಾದರಿ ಮಂಡನೆಯು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಹೊಸ ಕಾರ್ಯಗಳಿಗೆ ಗತಿಶೀಲವಾಗಿ ಹೊಂದಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾಗಿಸುತ್ತದೆ, ಭಾಷಾ ಮಾದರಿಗಳ ಕ್ಷೇತ್ರದಲ್ಲಿ ನಿಜವಾದ ಪ್ರಗತಿ ನೀಡುತ್ತದೆ.

ತೂಕಗಳನ್ನು ಹೊಂದಿಸಲು ಪ್ರಕ್ರಿಯೆ

ಸಾಂದರ್ಭಿಕವಾಗಿ, LLM ಹೊಸ ಬೇಡಿಕೆಗಳಿಗೆ ಹೊಂದಿಕೊಳ್ಳಲು ಫೈನ್ ಟ್ಯುನಿಂಗ್ ಅನ್ನು ಅಗತ್ಯವಿರುವುದು. ಈ ಪ್ರಕ್ರಿಯೆ ಬಳಸದೆ ಪರೀಕ್ಷಾ ಮಾದರಿಗಳನ್ನು ಹೊಂದಿಸಲು ಪರಾಮೆಟರ್‌ಗಳಲ್ಲಿ ಸುಧಾರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ ಮತ್ತು ಹೊಸ ಮಾದರಿಗಳೊಂದಿಗೆ ಹೆಚ್ಚುವರಿ ತರಬೇತಿಯನ್ನು ಒದಗಿಸುತ್ತದೆ, ಇದು ಸಾಮಾನ್ಯವಾದ ದೇಶಾದೇಶနိုင်ತೆಗಳಿಂದ ಹೆರಾಯಿಕೆಯಾದ ಶಕ್ತಿಯನ್ನು ಅಗತ್ಯವಿದೆ. ಈಗಾಗೆ, Transformer² ಹೊಸ ಮಾಹಿತಿಯು ಪ್ರಾಶಸ್ತಿ ಹಾಕಿಸಿ ತೂಕಗಳನ್ನು ಸರಿಹೊಂದಿಸುವ ಮೂಲಕ ಈ ಶ್ರಮವನ್ನು ಕಡಿಮೆ ಮಾಡುವ ಒಂದು ಪರಿಹಾರವನ್ನು ಒದಗಿಸುತ್ತದೆ.

ಗತಿಶೀಲವಾದ ಹೊಂದಾಣಿಕೆಯ Mechanism

ಅಡಾಪ್ಟೇಷನ್ ಪ್ರಕ್ರಿಯೆ ಎರಡು ಹಂತಗಳಲ್ಲಿ ಆಧಾರಿತವಾಗಿದೆ. ಪ್ರಥಮವಾಗಿ, ಮಾದರಿಯು ಉತ್ತರಗಳನ್ನು ಹಕ್ಕಿಸಲು ಅಗತ್ಯವನ್ನು ಬಳಸಿದ ವಿಧಕ್ಕೆ ಪ್ರಶ್ನಾಪಟ್ಟಿಕೆಯನ್ನು ವಿಶ್ಲೇಷಿಸುತ್ತದೆ. ನಂತರ, ಶ್ರೇಣೀಬದ್ಧವಾದ ಪ್ರಯತ್ನಗಳ ಪ್ರಸ್ತುತ್ತನ್ನು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಕುರಿತು ಗತಿ ಹಾಕುವ ಮೂಲಕ ತೂಕಗಳನ್ನು ಹೊಂದಿಸಿಕೊಳ್ಳುತ್ತದೆ. ಈ ವಿಧಾನವು ಪ್ರಮುಖ ಮಾಹಿತಿಗಳನ್ನು ಪ್ರಸಿದ್ಧ ಮಾಹಿತಿವನ್ನು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದಲ್ಲಿ ಚಿಕಿತ್ಸೆ ನೀಡಲು ಅನುಮತಿಸುತ್ತದೆ, ವಿಶಿಷ್ಟ ತರಬೇತಿ ಸುತ್ತುಗೋಚೆಗಳನ್ನು ಅಗತ್ಯವಿಲ್ಲ.

ಅದರ ಶ್ರೇಣೀಬದ್ಧವಾದ ಮೌಲ್ಯ ಮತ್ತು ಪ್ರತಿಯೊಂದು ವಿವರಣೆಗೆ ಒತ್ತುವಿಕೆ

Transformer² ಯಾ ವೃತ್ತಿಯ ನಿಷ್ಠಾವಂತ ವೃತ್ತಿತಂತ್ರವನ್ನು ಬಳಸಿಕೊಂಡು Singular Value Decomposition ಎಂದು ಹೆಸರಿಸಲಾಗಿದೆ. ಈ ಪ್ರಕ್ರಿಯೆ ತನ್ನ ಕಾರ್ಯ ಶ್ರೇಣಿಯನ್ನು ಖಾತರಿ ನೀಡಲು ಮೌಲ್ಯಗಳನ್ನು ಐಸೋಲೇಟ್ನಲ್ಲಿಡಲು ಅವಕಾಶವನ್ನು ನೀಡುತ್ತದೆ, ಪ್ರತಿಯೊಂದು ಪ್ರಶ್ನೆಗೆ ಉತ್ತಮ ಉತ್ತರವನ್ನು ಒದಗಿಸುತ್ತದೆ. ಶಿಕ್ಷಣ ನಿಯೋಜನೆಯ ಅನುಭವವು ಮಾದರಿಯ ಶ್ರೇಣ್ಯವನ್ನು ನಂಬಿಸುವ ಕಾರ್ಯವನ್ನು ಉತ್ತರಿಸುತ್ತದೆ, ಪ್ರತಿಯೊಬ್ಬರ ಅನುಭವವನ್ನು ರೂಪಿಸಲು ಉತ್ತಮ ಶ್ರೇಣೀಕರಣವನ್ನು ಒದಗಿಸುತ್ತದೆ.

ಹೆಚ್ಚಿನ ವಿವರಗಳಿಗೆ ಶ್ರೇಣೀಬದ್ಧವಾದ ಸಾಲಿಲ್

ಉತ್ತರಾದಿಯ ಸಂದರ್ಭದಲ್ಲಿ, ಉತ್ತರಗಳನ್ನು ಉತ್ಪಾದಿಸಲು Transformer² ಬಳಕೆದಾರನು ನೀಡಲು ಮೂರು ವಿಶಿಷ್ಟ ಮಾರ್ಗಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಮೊದಲ ಶ್ರೇಣಿಯು ಆರಂಭಿಕ ಜೊತೆಗೆ ಸಮಸ್ಯೆಯನ್ನು ಮತ್ತು ಶ್ರೇಣಿಯ ಎರಡನೆಯದು ಶ್ರೇಣೀಬದ್ಧವಾದ ಘಟಕ ಹಂತಗಳಲ್ಲಿ ಶ್ರೇಣೀಭವಿಸುವ ಮಾರುಕಟ್ಟೆ ಪ್ರಮಾಣವನ್ನು ಉತ್ತೇಜಿಸುತ್ತದೆ, ಹಾಗೆಯೇ ಮೂರನೆಯದು ಕಡಿಮೆ ಪ್ರಮಾಣದ ಮಾಹಿತಿಗೆ ಶ್ರೇಣೀಬದ್ದಗೊಂಡೆಯಾದ ಶ್ರೇಣೀಬದ್ಧವಾದ ಶ್ರೇಣೀಕರಣವನ್ನು ಕೈಗೆಂಡಿತು.

ಪ್ರದರ್ಶನ ಮತ್ತು ಅನಯಣ

ಮಾದರಿ ತೀರ್ಮಾನಗಳನ್ನು ಮೀರಿಸುವಾಗ Transformer² ಸಾಮಾನ್ಯವಾದ ಪ್ರಶ್ನೆಗಳಿಗೆ ಇತರ LLM ಗಳೊಂದಿಗೆ ಹೋಲಿಸುತ್ತಿದೆ, ಆದರೆ ಹೊಸ ಸಮಸ್ಯೆಗಳಿಗೆ ಪ್ರಮುಖವಾದ ಫಲಿತಾಂಶಗಳೊಂದಿಗೆ ಹೆಚ್ಚು ಅನಯಣಶೀಲವಿದೆ. ಇದು ಇತರ ಮಾದರಿಗಳನ್ನು ತಕ್ಷಣ ಬಯಸುತ್ತಿರುವ ಪ್ರಶ್ನೆಗಳಿಗೆ ಸೂಕ್ತವಾಗಿ ಉತ್ತರಿಸಲು ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ. ಈ ಹಂತ ಅನಯಣವು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯ ದಿಕ್ಕಿನಲ್ಲಿ ಪ್ರಾಸಂಗಿಕವಾಗಿರುವ ಆಕರ್ಷಣೆಗಳನ್ನು ನೀಡುತ್ತದೆ, ಜನರೇಟಿವ್ AI ಮತ್ತು ಮಾನವ-ಯಂತ್ರ ಸಂಬಂಧಾನ್ವಯತೆಗಳಿಗೆ ಪ್ರಭಾವಿಸುತ್ತದೆ.

ಸಾಮಾನ್ಯ ಪ್ರಶ್ನೋತ್ತರ

ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಏನು ಮತ್ತು ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ?
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಒಂದು ಭಾಷಾ ಮಾದರಿಯಾಗಿದೆ, ಇದು ಹೊಸ ಕಾರ್ಯಕ್ರಮಗಳಿಗೆ ಬೇಡಿಕೆಗಾಗಿ dynamically ತನ್ನ ತೂಕಗಳನ್ನು ಹೊಂದಿಸುತ್ತದೆ, ಸಂಪೂರ್ಣ ಫೈನ್ ಟ್ಯುನಿಂಗ್ ಅಗತ್ಯವಿಲ್ಲ. ಇದು ಬೇಡಿಕೆಗಳ ವ್ಯತ್ಯಾಸಗಳಿಗೆ ತ್ವರಿತವಾಗಿ ಹೊಂದಿಕೊಂಡು ಕಳೆದಾಗ ಅಪಾರವಾಗಿ ಪ್ರಯೋಜನ ನೀಡುತ್ತದೆ.
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಗಳು ತಮ್ಮ ತೂಕವನ್ನು ಹೊಂದಿಸಲು ಯಾವ ವಿಧಾನಗಳನ್ನು ಬಳಸುತ್ತವೆ?
ಈವು ಸ್ಥಳೀಯ ಶ್ರೇಣೀಬದ್ಧಗಳಂಥ ತಂತ್ರಗಳನ್ನು ಬಳಸುತ್ತವೆ, ಏಕೆಂದರೆ ಕೋಟರ್ ಶ್ರೇಣೀಬನ್ನು ವ್ಯಾಪಾರೀಕೃತಿಗೊಳಿಸುತ್ತದೆ ಮತ್ತು ಹೊಸ ಕಾರ್ಯಗಳಿಗೆ ತ್ವರಿತವಾಗಿ ಮಾಹಿತಿ ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆ ನೀಡುತ್ತದೆ.
ಆತ್ಮ-ಆಡಾಪ್ಟ್ LLM ನ ಕಾರ್ಯಾಚರಣೆಯ ಉತ್ತರವನ್ನು ಹೆಚ್ಚು ಸಾಕ್ಷಾತ್ಕಾರದಿಂದ ಹೇಗೆ ಸುಧಾರಿಸುತ್ತದೆ?
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಹೊಸ ಬೇಡಿಕೆಗಳ ಸ್ವಭಾವವನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಮತ್ತು ಅಗತ್ಯವಿರುವ ಪರಾಮಿತಿಗಳ ಮೇಲೆ ಗಮನವನ್ನು ಪಡೆದುಕೊಳ್ಳುವ ಮೂಲಕ ಉತ್ತರಿಸುವ ಶ್ರೇಣಿಯಲ್ಲಿ ಸಿಯಾಸತೆಯು ಹೆಚ್ಚುತ್ತದೆ.
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಮುಖ್ಯಮಂತ್ರಿ ನಿಖರವಾಗಿದೆ ಮತ್ತು ನಿಭಾಯಿಸಲು ಉತ್ಸಾಹಿಸುತ್ತದೆ?
ಹೌದು, ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ವೇದಿಕೆಯಂತಹ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಎರಡೂ ಮಾಹಿತಿಗಳನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ನಡೆಸುವಿಕೆಗೆ ಮತ್ತು ಕಂಪನ ಸೇವೆಗೆ ಸಾಧ್ಯವಾಗುತ್ತದೆ, ಕೆಲವು ಉದಾಹರಣೆಗಳಲ್ಲಿಯೇ ಶೀಘ್ರವಾಗಿ ಕಲಿಯುತ್ತದೆ.
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ನ ಸ್ಥಿರ ಘಟಕಗಳಲ್ಲಿ ಯೋಗ್ಯತೆಗಳ ನಿರ್ಧಾರಗಳು ಏನೆಂದು?
ಈ ಸ್ಥಿತಿಯಲ್ಲಿ ಹೆಚ್ಚು ತಂಡಗೆ ಉತ್ಸಾಹ ಸಂಬಂಧಗಳು, ವೇಗಿತ ಸಮಯಗಳಲ್ಲಿ ಉತ್ತರಿಸಿದರು, ಪ್ರತಿಯೊಂದು ಹೊಸ ಕಾರ್ಯಗಳಲ್ಲಿ ಸುಲಭತೆ ಏನೆಂದು ನೋಡಿ.
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಒಬ್ಬ ನಿಷ್ಠಿತತೆಯಲ್ಲಿ ಹೇಗೆ ಉತ್ತಮವಾಗಿ ನಿರ್ವಹಿಸುತ್ತವೆ?
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಪ್ರಿಕ್ ಸತತ ಅಂಗವು ಪ್ರಾರಂಭದ ಮೆಟ್ರಿಕ್ ಪುಟಗಳ ಮೂಲಕ ದಾಖಲಿಂದ, ಯಾವ ಸ್ಥಳೀಯತಾ ತಂತ್ರವನ್ನುಕೊಡುವ ಮೂಲಕ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಅತ್ಯಂತ ಮುಂದಿನ ಅವರಾಂಗಿಲ್ಲದೆ.
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ನ ಶ್ರೇಣೀಬದ್ದ ಶ್ರೇಣಿಗಳು ತಿಂಗಳಿಗೆ ಹೋಲಿಸುತ್ತವೆ?
ಆತ್ಮ-ಆಡಾಪ್ಟಿವ್ LLM ಉತ್ತಮವಾಗಿ ಶ್ರೇಣೀಬದ್ದಉಪಾಯಗಳ ನೇಮಕ ಮಾಡುತ್ತವೆ.

actu.iaNon classéಒಂದು ಸ್ವಯಂ-ಅನುಕೂಲಿತ LLM ಹೊಸ ಕಾರ್ಯಗಳನ್ನು ಮುಟ್ಟಲು ತನ್ನ ಭರ್ತಿಯನ್ನು ಜ್ವರಗೊಳಿಸುತ್ತದೆ

ಆಪಲ್ (AAPL) ನ ಅಂಗಗಳು ಸಿರಿಯ ಪುನರ್ಣವಿ ಮಗ ಮತ್ತೆ ಒಪನ್‌ಐಎ ವಿರುದ್ಧ ಸ್ಪರ್ಧಿಸಲು ಉಂಟಾಗುತ್ತವೆ

découvrez comment les actions d'apple (aapl) ont grimpé suite à une importante refonte de siri, conçue pour concurrencer openai et perplexity dans le domaine de l'intelligence artificielle.
nick frosst de cohere affirme que leur modèle cohere command surpasse deepseek en efficacité, avec des performances supérieures de huit à seize fois. découvrez les avancées de cohere dans le domaine de l'intelligence artificielle.
découvrez comment les étudiants réagissent face à l'utilisation de l'ia par leurs enseignants pour préparer les cours, alors que son usage leur est interdit. analyse d'une révolte grandissante et des enjeux autour de chatgpt dans l'éducation.
recevez des alertes instantanées en cas de détresse aiguë de votre enfant lors de l'utilisation de chatgpt. protégez vos enfants en restant informé et intervenez rapidement.
découvrez comment un robot innovant parvient à manipuler des objets volumineux avec la dextérité d’un humain après une seule leçon, une avancée impressionnante en robotique.
découvrez comment une approche innovante en intelligence artificielle générative permet d’anticiper avec précision les réactions chimiques, révolutionnant ainsi la recherche et le développement en chimie.