DeepL ya no solo traduce texto: lanza traducción voz a voz completa para reuniones, móviles y trabajadores de primera línea, con API para call centers

Wait 5 sec.

DeepL, la empresa alemana que durante años ha sido referencia en traducción de texto, ha lanzado este 16 de abril un suite completo de traducción voz a voz que cubre reuniones (con add-ons para Zoom y Microsoft Teams), conversaciones en móvil y web, y conversaciones grupales para trabajadores de primera línea a través de apps personalizadas. Además, publica una API que permite a terceros integrar la tecnología en sus propios productos, con los call centers como caso de uso principal. Lo reporta Ivan Mehta en TechCrunch, con declaraciones del CEO Jarek Kutylowski. El movimiento convierte a DeepL de un competidor de Google Translate a un competidor directo de startups como Sanas (65 millones de dólares de Quadrille Capital), Camb.AI (doblaje para Amazon y entretenimiento) y Palabra (respaldada por Seven Seven Six de Alexis Ohanian), todas trabajando en traducción de voz en tiempo real.Kutylowski explicó a TechCrunch que el mayor desafío técnico es el equilibrio entre latencia (el retardo entre hablar y escuchar la traducción) y precisión. Un sistema muy rápido pero impreciso es inútil en una negociación comercial; uno preciso pero con tres segundos de retardo rompe el flujo natural de la conversación. El stack actual de DeepL convierte voz a texto, aplica traducción y reconvierte a voz, aprovechando los años de optimización de su motor de texto como ventaja competitiva en la calidad de la traducción intermedia. La compañía reconoce que el futuro está en un modelo end-to-end de voz a voz que omita el paso de texto, y dice estar trabajando en ello.El producto para reuniones se integra con Zoom y Teams mediante add-ons que permiten a los asistentes escuchar traducción en tiempo real mientras otros hablan en su idioma nativo, o seguir texto traducido en pantalla. Por ahora está en acceso anticipado, con lista de espera para organizaciones. Para conversaciones uno a uno (presenciales o remotas), hay un producto de móvil y web. Para grupos en entornos de primera línea (formaciones, talleres, sesiones de equipo), los participantes se unen mediante un código QR y reciben la traducción de todos los ponentes. El sistema también aprende vocabulario personalizado, como términos de industria, nombres de empresa y nombres personales, lo que lo diferencia de las soluciones de traducción genérica.DeepL lanzó la primera versión de DeepL Voice en noviembre de 2024, pero aquella versión solo mostraba traducciones en texto, no generaba audio traducido. En febrero de 2026, la compañía presentó la DeepL Voice API orientada a empresas y centros de contacto, con transcripción y traducción en tiempo real pero aún sin salida de audio sintético. Lo de hoy es el cierre del circuito: voz de entrada, voz traducida de salida, en múltiples escenarios de uso. Y la API abierta a terceros es la pieza que permite a cualquier plataforma de contact center o software empresarial construir sobre la tecnología sin tener que desarrollar su propia cadena de traducción.El ángulo empresarial que vende DeepL es pragmático: contratar agentes de soporte por idioma es caro y lento. Si puedes contratar por habilidades de atención y empatía en lugar de por idiomas, el pool de candidatos se multiplica y los costes bajan. Para operaciones 24/7 con picos estacionales o campañas multinacionales, eso puede marcar la diferencia entre responder en minutos o en horas. La compañía también ha expandido recientemente su cobertura lingüística con catalán, euskera, gallego y aragonés, un movimiento que en el contexto español es particularmente relevante para administraciones y empresas que operan en comunidades con lenguas cooficiales.Mi valoración: DeepL tiene una ventaja que a menudo se subestima: la confianza empresarial. Mientras Google Translate tiene más volumen de usuarios, DeepL tiene más presencia en flujos de trabajo corporativos donde la calidad de traducción importa (contratos, documentación técnica, comunicación con clientes). Esa confianza es directamente transferible a la traducción de voz empresarial. El riesgo es que la cadena speech-to-text-to-translation-to-speech introduce múltiples puntos de fallo (errores de transcripción que se amplifican en la traducción), y que competidores con modelos end-to-end (que traducen directamente de audio a audio sin pasar por texto) podrían ofrecer resultados más naturales a menor latencia. DeepL lo sabe y dice que está trabajando en ello.Hay un detalle que conviene no pasar por alto: la capacidad de aprender vocabulario personalizado. En muchos sectores, el vocabulario técnico marca la diferencia entre una traducción útil y una confusa. Si un ingeniero de automoción habla de «junta de culata» y el sistema traduce genéricamente, el receptor no entenderá la especificidad técnica. La adaptación a glosarios sectoriales es exactamente lo que distingue a una herramienta de traducción profesional de una consumer. DeepL lleva años trabajando en glosarios personalizados para texto, y traer esa capacidad a la voz es un diferenciador real frente a startups como Sanas o Palabra que no tienen esa base terminológica acumulada.Para empresas europeas que necesitan traducción de voz ahora, DeepL es la opción más seria por trayectoria, cumplimiento GDPR y calidad probada. Para el futuro a 2-3 años, habrá que ver si el modelo end-to-end cambia las reglas. Lo que parece claro es que la traducción de voz en tiempo real dejará de ser un producto de nicho para convertirse en infraestructura básica de comunicación empresarial, al mismo nivel que el correo electrónico o la videoconferencia.Preguntas frecuentes¿Puedo usar DeepL Voice gratis? No. El producto de voz es parte de DeepL Pro y tiene precios separados. El acceso a reuniones está en early access con lista de espera. ¿En qué idiomas funciona? El reconocimiento de voz soporta actualmente inglés, alemán, japonés, coreano, sueco, neerlandés, francés, turco, polaco, portugués, ruso, español e italiano. La traducción puede mostrar resultados en todos los idiomas que soporta DeepL. ¿Es mejor que Google Meet con subtítulos traducidos? Depende del caso. Google Meet ofrece subtítulos traducidos nativos pero con calidad de traducción variable. DeepL apuesta por mayor precisión usando su motor de traducción optimizado, pero requiere instalar un add-on y está limitado a Zoom y Teams por ahora.La noticia DeepL ya no solo traduce texto: lanza traducción voz a voz completa para reuniones, móviles y trabajadores de primera línea, con API para call centers fue publicada originalmente en Wwwhatsnew.com por Natalia Polo.