AI模型訓練策略新進展 RLSD兼顧穩定與效率

Wait 5 sec.

圖/本報AI製圖(示意圖)商傳媒|葉安庭/綜合外電報導人工智慧領域研究人員近日提出一項名為「自我蒸餾強化學習」(RLSD)的新型策略,旨在解決大型語言模型(LLM)訓練過程中,如何同時維持學習穩定性與