Мы десятилетиями решаем одну и ту же задачу двумя разными способами — и называем это прогрессом. Метрики оценки и модели вознаграждения в LLM-комьюнити развиваются как параллельные ветви эволюции, почти не обмениваясь знаниями. Статья 2510.03231 показывает, насколько глубока эта изоляция — и как объединение подходов может сделать оценку моделей проще, точнее и… дешевле в вычислительном смысле. Это не просто обзор — это рефакторинг всей исследовательской экосистемы. Читать далее