Гибридный поиск в RAG: как мы подняли Top-1 с 62% до 88% на базе из 50 000 документов Если вы строили RAG, вы…
Гибридный поиск в RAG: как мы подняли Top-1 с 62% до 88% на базе из 50 000 документов Если вы строили RAG, вы знаете эту боль: вектор-поиск красиво работает на демо-вопросах, но в продакшене теряется на номерах договоров, артикулах и аббревиатурах. Я расскажу, как мы добавили к чисто векторному поиску BM25, слили два ранкинга через RRF и поставили сверху cross-encoder. На внутренней базе из 50 000+ корпоративных документов это подняло Top-1 с примерно 62% до 88%, а время ответа ост... https://clck.ru/3Txcvc
Автор: Habr все новости об IT