Она способна выполнять до 300 последовательных действий, строя цепочку логики, поиска и кода. В тестах вроде Humanity’s Last Exam, BrowseComp и SWE-Bench она поставила новые рекорды.Эта модель — очередной шаг в направлении масштабирования вычислений во время выполнения, благодаря увеличению как количества «токенов размышления», так и числа шагов при вызове инструментов.Kimi K2 Thinking устанавливает новые рекорды на бенчмарках, оценивающих логическое мышление, кодинг и агентные способности. Читать далее