AI模型訓練策略新進展 RLSD兼顧穩定與效率

Wait 5 sec.

圖／本報AI製圖（示意圖）商傳媒｜葉安庭／綜合外電報導人工智慧領域研究人員近日提出一項名為「自我蒸餾強化學習」（RLSD）的新型策略，旨在解決大型語言模型（LLM）訓練過程中，如何同時維持學習穩定性與