Дэнис Ротман | RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon (2025) [PDF]
Автор: Дэнис Ротман
Издательство: Спринт Бук
ISBN: 978-601-12-3149-7
Жанр: Компьютерная литература
Формат: PDF
Качество: Изначально электронное (ebook)
Иллюстрации: Черно-белые
Описание:В книге описываются приемы создания эффективных больших языковых моделей, систем компьютерного зрения и генеративного ИИ, показывающих высокую производительность при относительно невысоких затратах. В ней приводится подробное исследование технологии RAG, а также подходов к проектированию мультимодальных пайплайнов ИИ и управлению ими. Связывая вывод с исходными документами, RAG повышает точность и контекстную релевантность результатов, предлагая динамический подход к управлению большими объемами информации.
Узнайте, как построить инфраструктуру RAG, попутно разобравшись с векторными хранилищами, фрагментацией, индексацией и ранжированием. Познакомьтесь с методами оптимизации производительности и приемами более глубокого изучения данных, включая использование адаптивного RAG и обратной связи от человека для уточнения поиска, тонкую настройку RAG, реализацию динамических RAG для поддержки принятия решений в реальном времени и визуализацию сложных данных с помощью графов знаний. Вы также увидите, как на практике объединить такие фреймворки, как LlamaIndex и Deep Lake, векторные базы данных наподобие Pinecone и Chroma и модели, предлагаемые компаниями Hugging Face и OpenAI. Приобретите навыки внедрения интеллектуальных решений, что повысит вашу конкурентоспособность в различных областях: от продакшна до обслуживания клиентов в любом проекте.
Оглавление
Об авторе...................................................................................................... 11
О научных редакторах.................................................................................... 12
Предисловие.................................................................................................. 13
От издательства............................................................................................. 19
Глава 1. Почему именно генерация с дополненной выборкой (RAG)................... 20
Глава 2. Хранение эмбеддингов RAG с помощью Deep Lake и OpenAI................. 52
Глава 3. Реализация индексированной RAG с помощью LlamaIndex,
Deep Lake и OpenAI....................................................................................... 80
Глава 4. Мультимодальная RAG.......................................................................110
Глава 5. Повышение эффективности RAG за счет обратной связи от эксперта....136
Глава 6. Масштабирование банковских данных клиентов в системе RAG
с помощью Pinecone.......................................................................................161
Глава 7. Создание масштабируемой RAG на основе графа знаний
с помощью API Википедии и LlamaIndex..........................................................199
Глава 8. Создание динамических RAG с помощью Chroma и Hugging
Face Llama.....................................................................................................227
Глава 9. Улучшение моделей ИИ: тонкая настройка данных RAG
и обратная связь...........................................................................................253
Глава 10. RAG для создания стоковых видео с помощью Pinecone и OpenAI........271
Приложение..................................................................................................307
Скриншоты:
Время раздачи: с 09:00 до 21:00 (минимум до появления первых 3-5 скачавших)