Jurnalul
Publicat acum 144 zile

Un nou studiu arată cum modelele AI pot deveni mai precise în sarcini complexe prin antrenament

Factor Manipulare: --
  • Cercetătorii au demonstrat că tehnica de 'antrenare temporară în timpul rulării' poate îmbunătăți performanța modelelor de limbaj de până la șase ori față de metodele tradiționale.
  • Ekin Akyürek, doctorand MIT, a explicat că modelele mari de limbaj nu pot învăța noi abilități după lansare, dar ajustările temporare pot aduce îmbunătățiri semnificative.
  • Metoda implică ajustarea temporară a parametrilor interni ai modelului folosind un set restrâns de date, fără a modifica permanent modelul.
  • Cercetătorii intenționează ca modelele LLM să decidă automat aplicarea 'antrenării temporare', iar studiul va fi prezentat la International Conference on Machine Learning (ICML) din Vancouver.
0 articole