Оптимизация языковой модели Mamba для выполнения на CPU

Wait 5 sec.

Как оптимизировать модель Mamba для выполнения на CPU? Ускоряем код в 20 раз по сравнению с PyTorch, нарушая в процессе все правила оптимизации. Читать далее