На arXiv опубликован препринт с описанием нового способа проверки больших языковых моделей — "теста Гёделя" (название дано в честь Курта Гёделя, символа строгих математических доказательств). В отличие от привычных бенчмарков, он проверяет не умение решать известные задачи, а способность находить новые, пусть и простые, математические результаты. Читать далее