Корпоративная память как инфраструктура: как мы построили RAG-систему внутри ИТ-компании с промышленной экспертизой

Wait 5 sec.

Привет, Хабр! Меня зовут Дмитрий Омаров, я ведущий инженер учебного центра по продуктам в компании «Цифра». Вместе с моим коллегой, Фёдором Арефьевым, мы решили поделиться своим опытом создания корпоративного агента, который в разы ускоряет поиск по базам знаний компании.Внутри статьи: мы подробно разбираем архитектуру RAG-пайплайна — от локального векторного поиска и реранкинга до сборки контекста для облачной LLM. Вы узнаете, почему мы отказались от дообучения моделей в пользу динамической базы знаний, как реализовали локальную очистку данных от чувствительной информации для соблюдения требований информационной безопасности и каким образом системный промпт помогает победить «галлюцинации», гарантируя опору только на факты и ссылки на первоисточники.Статья будет полезна тем, кто решает задачу эффективного доступа к знаниям внутри компании и ищет баланс между качеством генерации, стоимостью инфраструктуры и требованиями ИБ. Читать далее