Компания ElevenLabs представила Scribe — свою первую модель автоматического распознавания речи (ASR), которая уже признана самой точной в мире. Scribe поддерживает 99 языков, обеспечивая временные метки, разделение по спикерам и распознавание аудио-событий (например, смеха) для удобной интеграции в любые системы.В ходе тестирования на бенчмарках FLEURS и Common Voice модель превзошла лидеров рынка, включая Gemini 2.0 Flash, Whisper Large V3 и Deepgram Nova-3.Она демонстрирует самый низкий уровень ошибок в таких языках, как итальянский (98,7%), английский (96,7%) и еще 97 других. Читать далее