RAG

Большая языковая модель (LLM) — это тип искусственного интеллекта (ИИ), который использует машинное обучение для генерации текстовых ответов, схожих с человеческими, на запросы.
Обучение: LLM обучаются на огромных объемах текстовых данных, чтобы изучить статистические связи между словами и предсказывать следующее слово или последовательность слов в предложении, создавая связный и контекстно релевантный текст.

Ограничения больших языковых моделей (LLM):
1.Ограниченная база знаний:

LLM не могут получить доступ к новой или актуальной информации после обучения, что приводит к устаревшим ответам.

2.Галлюцинации:

LLM иногда генерируют правдоподобную, но неточную информацию, не указывая на неопределенность в своих ответах.

3.Отсутствие контекстной релевантности:

LLM предоставляют обобщенные ответы, не имея доступа к специфическим или частным данным, необходимым для точных ответов.

4.Проблемы в специфических областях:

Стандартные LLM часто сталкиваются с трудностями в работе с техническим жаргоном и точностью в специализированных областях.

5.Риски безопасности и конфиденциальности:

LLM не имеют встроенных механизмов контроля доступа, что может привести к рискам утечек данных при обработке чувствительной информации.

6.Неоднородное качество ответов:

Ответы могут различаться и ухудшаться при сложных многозадачных вопросах, что снижает их надежность.

Retrieval Augmented Generation

RAG — это метод, который комбинирует процессы поиска и генерации для создания более точных и информативных ответов. Он используется в моделях, которые не только генерируют текст, но и активно извлекают релевантную информацию из внешних источников для улучшения качества ответа.
RAG — дополнительно обрабатывает запросы пользователей, используя релевантные внешние данные для улучшения ответов больших языковых моделей (LLM), таких как GPT-4 или Llama.
Процесс разработан для преодоления ограничений LLM, предоставляя информацию, специфичную для контекста, что позволяет давать точные, актуальные и релевантные ответы.
RAG расширяет базовый запрос, превращая его в более богатый, информационно улучшенный запрос, что повышает качество вывода.

Зачем использовать RAG с большими языковыми моделями?
Retrieval-Augmented Generation (RAG) используется с большими языковыми моделями (LLM), чтобы улучшить качество их вывода:

Доступ к актуальной информации
RAG позволяет LLM получать доступ к внешним источникам данных, что помогает обеспечить более точные и актуальные ответы.
Снижение количества галлюцинаций
RAG помогает предотвратить генерацию некорректной или вымышленной информации, известной как галлюцинации.
Экономичность
RAG — это простой и экономически эффективный способ улучшить вывод LLM без необходимости переобучать модель.
Ответы, специфичные для домена
RAG может предоставлять ответы, адаптированные к специфическим данным организации.
Прозрачность
RAG можно настроить так, чтобы он указывал свои источники, что облегчает отслеживание того, как был сгенерирован ответ.

Компоненты системы RAG

Подготовка данных: Сбор и структурирование данных для эффективного извлечения.
Встраивание текстовых фрагментов: Преобразование информации в векторную форму, c с учетом семантики.
Хранение векторов: Использование векторных баз данных для организации и эффективного извлечения векторов.
Дополнение/извлечение запросов: Объединение пользовательского запроса с извлеченным контекстом для предоставления языковым моделям полного вопроса.

Embedder model — это модель машинного обучения, которая преобразует текстовые данные (или другие виды данных, такие как изображения или звуки) в числовые векторы, называемые встраиваниями (embeddings). Эти встраивания представляют собой компактные, многомерные представления данных, которые сохраняют их семантическую информацию.
Как это работает:

Пространственная репрезентация: Вместо того, чтобы обрабатывать текст в его исходной форме (например, строках слов), embedder model преобразует текст в вектор.
Семантические связи: Вектора, полученные с помощью embedder model, сохраняют семантические связи между объектами. Например, вектора для слов “король” и “королева” будут близки друг к другу в пространстве, потому что они семантически связаны.
Ключевая роль в поиске по вектору: Позволяют RAG извлекать контекстуально релевантные данные из больших наборов данных, сопоставляя схожесть векторов.

Этапы работ
Шаг 1 — Загрузка документов

Начало статьи