Project Headroom kompresuje tokeny przed wysłaniem do modelu językowego, eliminując powtarzające się dane. Logi serwera odchudza o 90%, JSON o 70%. Łącznie zaoszczędzono grupie użytkowników ponad 700 tys. dol. przy 200 mld tokenów. Kod dostępny na GitHubie.