Это саммари подкаста Ленни Рачицкого с Хамилем Хусейном и Шреей Шанкар. Ниже — главные идеи, и пошаговый процесс проведения оценки .Мы живем в эпоху, когда топ-менеджеры Anthropic и OpenAI называют еvals (оценка качества AI-продукта) самым важным навыком для продакт менеджеров. Два года назад никто не знал этого слова, а сегодня это новая нефть в мире LLM. Читать далее