Вы уверены, что для внедрения корпоративного ИИ в закрытом контуре нужны суперкомпьютеры? Мы решили это проверить и добиться вменяемого качества от крошечной модели в максимально жестких условиях. CPU вместо GPU, закрытый контур.Кейс – научить крошечную LLM отвечать на вопросы по программе газификации РФ. В статье пошаговый разбор, код LLLaMBA для автоматизации бенчмарка и готовые конфиги. Повторите эксперимент на своих данных! Узнать, как мы это сделали