Когда ИИ слишком уж соглашается: Spiral-Bench разоблачает, какие модели склонны подпитывать бред

Wait 5 sec.

Исследователь ИИ Сэм Пех придумал новый тест под названием Spiral‑Bench — и тот наглядно демонстрирует, как некоторые модели затягивают собеседников в «спираль нарастающих иллюзий».Spiral‑Bench измеряет, насколько велика вероятность, что ИИ попадёт в ловушку подхалимства — когда он слишком поспешно соглашается с идеями пользователя. Тест запускает 30 симулированных диалогов, каждый — по двадцать ходов. Читать далее