Стартап Rosebud опубликовал результаты своего бенчмарка CARE, в котором 21 ИИ-модель проверялась на способность распознать критические ситуации в диалогах с пользователем. Читать далее