Компания xAI Илона Маска представила новый Text-to-Speech API — инструмент, который превращает обычный текст в живую, выразительную речь. Изначально доступны 5 уникальных голосов: Eve, Ara, Rex, Sal и Leo. Самое интересное — управление эмоциями и интонацией прямо в тексте. Можно писать: «Так я зашёл и [пауза] вот оно. [смех] Я просто не поверил своим глазам!». Или использовать теги, вроде, (для шёпота), (для замедления). Паузы, смех, вздохи, дыхание, изменения громкости, высоты тона и скорости — судя по первым отзывам всё это работает отлично и без дополнительных настроек. Изображение Grok API поддерживает WebSocket для потоковой передачи речи в реальном времени и разные аудиоформаты, включая MP3 и mu-law.