Un team del Massachusetts Institute of Technology ha sviluppato TLT, un sistema che sfrutta il tempo di calcolo inutilizzato durante il reinforcement learning per accelerare l'addestramento dei "reasoning LLM" fino al 210% senza perdita di accuratezza. La tecnica riduce costi ed energia migliorando l'efficienza complessiva del training.